作者danny0838 (道可道非常道)
看板Browsers
标题Re: [闲聊] Project Coffee Jazz 词汇用语正简转换
时间Thu Apr 26 03:22:07 2018
既然有人要入坑,就拿个很久前的旧作充数XD
https://github.com/danny0838/sts-lib
此专案的主要目标是提供能有效整理各种简繁转换对照表的框架,
供不同情境使用,以及几个层次的转换脚本。
主要程式语言是 Python + Shell Script (CMD)。
大部分转换表资料来自OpenCC和维基百科,但後来做了不少整理。
因为是很古老的专案,充斥着很多不适合公开的版本记录,
所以暂时先丢最新版本。之後有空整理再补上旧的版本历程。
个人是建议如果可以的话,转换表格式尽量用纯文字档,
日後用各种程式比对及整合会比较方便。
※ 引述《t7yang (t7: 攻城蝨)》之铭言:
: 不知道大家对这个 2016 年 11 月的一篇幻想文还有印象吗?
: 现在他不只是幻想了,而且他还正要实现了。
: 当时我还只是一个刚上手写 JS 而已,根本只是个许愿文而已。
: 後来辗转实力提升了不少,加上对新同文堂很不满意
: 但是无奈现有的程式码缺乏有效的管理,後来就选择了自干了
: 原本没有没有想要继承新同文堂的,但是被 ett 拉了回来
: 所以就把这个代号改了一下,作为新同文堂 2.0 的开发代号
: Project Jazz Cafe NEED YOU (新同文堂 2.0 需要你)
: * 一组新的图示(包含亮色系跟暗色系),可能还有其他的图示
: (你可以设计你的版本,最後我们再来投票)
: * 重组字典档专案(因应新的演算法和新增转换用语预设字典档)
: 对上述议题有兴趣的人请联络我,我需要你的协助,或引介人才给我
--
《终结内容农场》浏览器套件
Firefox:
https://mzl.la/2g0I0ry (桌机 & Android 手机)
Chrome:
http://bit.ly/2wDWWyP
真相1:
https://i.imgur.com/JKPzD1L.png
真相2:
https://i.imgur.com/WTHmuVJ.png
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.243.225.237
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Browsers/M.1524684132.A.D9D.html
1F:→ t7yang: 看起来不错喔。当初也有想去opencc那里借资源的,只是那个 04/26 09:13
2F:→ t7yang: 一对多的部分不好处理。如果你已经有处理好的东西可以用 04/26 09:14
3F:→ t7yang: 最好。储存格式的话,最终还是要转到JSON,浏览器那里才能 04/26 09:14
4F:→ t7yang: 比较好处理 04/26 09:14
JSON喂浏览器和node.js的确比较方便,
但编辑转换表的人会非常痛苦,
也不容易做版本控管、差异比对、不同版本整合,
尤其你的开发目标是让使用者容易自订转换表,
我想不是每个使用者都了解JSON规格且有能力编辑。
当然你可以在使用者介面提供编辑转换表的功能,
但一般而言在使用者介面做大规模编辑不会比汇出成纯文字档、编辑、再汇入方便。
所以我会建议原始档用纯文字,如有效能考量,
动态做JSON或其他格式的快取即可。
※ 编辑: danny0838 (111.243.227.36), 04/26/2018 13:35:53
5F:→ t7yang: 多人共编处理的问题很重要,所以我其实是想直接用G社的 04/26 14:53
6F:→ t7yang: 试算表来维护,开发者再透过 CSV 去後制成 JSON 方到套件 04/26 14:54
7F:→ t7yang: 线上试算表的好处就是简单、容易用、支援多人共同编辑 04/26 14:55
8F:→ t7yang: 还有版本控制。剩下的事情就是交给开发者去处理。 04/26 14:56
9F:推 t7yang: 补个推,一直没推到 04/26 20:25
如果是把Google试算表当原始档,程式直接读来用,那根本没有JSON或纯文字的问题。
如果是要定时人工把Google试算表的资料转进程式里,纯文字大概还是比JSON好处理。
此外如果转换表要进版本库,JSON也很不利版控和差异比对...
我会这麽说是因为我另一个更早的专案就是用JSON转换表,
之後维护转换表的工作只能说非常痛苦...
当然最终怎麽做还是看你的整体规画啦。
10F:推 oversky0: 萌典有两岸辞典。不过不知有没有版权问题。 04/26 21:41
11F:→ oversky0: 两岸词典由中华文化总会提供, 04/26 21:43
12F:→ oversky0: 采用 CC BY-NC-ND 3.0 台湾授权。 04/26 21:43
※ 编辑: danny0838 (111.243.227.36), 04/26/2018 22:26:05
14F:推 karst10607: 推,这部分我回来了,我会帮忙 05/08 08:49