作者danny0838 (道可道非常道)
看板EZsoft
标题[情报] 简繁秘书-简繁转换暨校对程式
时间Thu Mar 18 01:22:28 2010
软体名称:
简繁秘书
软体特色:
*简化字与繁体字互转,并能逐一校对或取代所有转换後可能出错的字。
*为网页程式,超短小超绿色。免安装、可在网路或本机上使用。
*可自行建立字库、词库
详细介绍:
随着技术的进步,简繁转换软体多如繁星,似乎毋庸介绍亦无须研发。然而简
繁转换正确率之瓶颈一直无法突破,简体转繁体尤为明显,从「字」的层次上说,
「干」扰、头「发」、乙「丑」等怪词层出不穷;从「词」的层次上说,「小明带
了一台计算机去考试」,天晓得他实际上带的是「电脑」还是「计算机」?更有不
可能判断的句子如对照表「简繁转换常见错字:干[干干乾干]、叶[叶叶]」…
…繁转简的问题少得多,但偶尔还是会发生,比如「乾隆」不是「干隆」,「原着
」不是「原着」,「症结」也不是「症结」。
显然,在真正的人工智慧出来以前,简繁转换永远不完美,只要对「正确」有
所要求,事後人工校对绝对不可避免。因此,本程式的想法也很简单──用机器辅
助人工校对。亦即先用程式转换,但把「所有转换过」或「所有转换过可能出错(
一对多)」的地方上色,并允许使用者逐一校对、选字,如此可省下很多校对时间
,至少可以保证在run过一遍後,不再有任何简繁转换上的错误。
由於「人工校对」之需求,加上javascript有一定的限制(无法存取本机资源
),本程式目前只实作了转换纯文字内容的功能──而且本文也不能太大,否则虽
然可以转,但浏览器会顿到让你忍无可忍。
转换技术上,本程式提供了最起码、最常见的字库、词库对照表,完全开放,
也允许使用者自行修改(本机使用的话),期待藉此抛砖引玉,有更多高手能够在
此基础上开发更好用的转换工具。
在开发此程式前,作者亦整理了数个常见的简繁对照表,及相关参考资料,可
在这里找到:
https://danny0838.bitbucket.io/tools/sts-ref/table.html
下载连结:
https://danny0838.bitbucket.io/tools/sts
(可直接在浏览器上操作,或另存原始码到本机)
谁适合用:
1、对文章之简繁转换有正确之需求者。
2、有意开发、改进简繁对照之字库、词库者。
谁不适合用:
1、只想快速把简化字变正体字,不管错得多离谱者。
2、有处理非纯文字档案之需求者。
3、想批次转换大量档案或档名者。
其他:
初步构想来自
#19TDNGN8 (Chinese),并参考网友「有女同车」之程式实作
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 118.160.49.204
1F:推 way7344:试用了一下,很直觉且好用 (但不适用於字幕 03/19 00:12
3F:推 nadoka:我比较想要BG->Big5 加校正 QQ 03/19 01:40
※ 编辑: danny0838 来自: 220.136.159.233 (03/19 21:19)
原网址失效,已修正为搬家後的网址
※ 编辑: danny0838 (36.225.77.116), 12/01/2017 17:04:32
※ 编辑: danny0838 (59.115.48.101 台湾), 04/21/2024 21:09:13