作者Neisseria (Neisseria)
看板DataScience
标题[问题] 拿中文句子分析程式套古文的字典
时间Sat Aug 7 15:01:18 2021
作业系统:(ex:mac,win10,win8,win7,linux,etc...)
不限,询问概念性问题
问题类别:(ex:ML,SVM,RL,DL,RNN,CNN,NLP,BD,Vis,etc...)
NLP
使用工具:(ex:python,Java,C++,tensorflow,keras,MATLAB,etc...)
假定是 jieba,但套别的中文句子分析程式也可以
问题内容:
如果拿现代中文的句子分析程式,像 jieba
但是把字典的部分换成古文的词汇
这样跑出来的结果还行吗?
当然这个古文词典目前是不存在的
也不是做研究用的
只是想做个把古文句子拆解的小程式
古文的范围很广,这样会做不完
可能会限制范围,像是孔孟老庄墨法之类的
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.231.177.247 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1628319680.A.ED3.html
1F:→ hsnuyi: 你字典够强就可啊 苦工是在建立字典上 又不是分词 08/07 19:00
2F:推 st1009: 可以考虑看看中文Bert 08/07 19:36