作者wahaha99 (成为乡民中道的力量)
看板HOT_Game
标题Re: [讨论] 太难打了拉ˊˋ
时间Wed Sep 19 08:06:33 2007
现在不能做OCR还有一个很重要的因素,就是现在没有规则辅助辨识,
以之前的状况来说只剩25%不到的辨识率,如果没有规则辅助辨识,
(像是字数限制,字母限制等),辨识率会惨不忍睹。
不同的杂讯模式 (像之前的毛玻璃模式) 也会导致辨识的结果有很大的差异。
除非能写出一套可以分辨图片模式的OCR,会自动对应不同模式切换,
但这个超过我的人力物力范围了(每种图都要有足够的量来分析,建模,跑参数测试...)
即使写出来,以现在的电脑是否能在时限内辨识完成也是未知数。
(我写的程式效率不好,因为不是用能用指标的c,也不是用现成函式或library,
所有的演算都是在矩阵内硬干的...)
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.166.52.107
1F:推 K122324090:比起OCR..我觉得我们的兵器跟E鲭要先重整过比较重要 09/19 08:10
2F:推 yamaka:哇哈哈大辛苦了~~ 09/19 08:23
3F:推 JANYUJEN:我觉得现在的数字可以用扫描器用的辨识软体耶 09/19 10:20
4F:→ JANYUJEN:像是汉青之类的软体.... 反正数字也不模糊阿 09/19 10:22
5F:推 JANYUJEN:丹青才对... 不过一套260MB,而且盗版在这讨论不适合 09/19 10:27
6F:推 ChaosK:辛苦了~~ 09/19 11:41