作者TiffanyPany (JackyLee)
看板Python
标题[问题] jieba自定义字典後仍无法正确断词
时间Tue Oct 18 03:52:01 2022
想请教一下有使用过Jieba断词的板友
目前遇到目前遇到状况如下
例如说我把「超前部属」加入自定义字典,并且把权重加得很高
但看了一下断词完出来的结果,只有少数被成功断成「超前部属」,多数仍是超前+部属
想请问一下有甚麽方式可以让我自定义的单字能够优先被识别呢?
感谢各位(跪
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 60.96.185.59 (日本)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1666036324.A.FEA.html
1F:推 lycantrope: 觉得蛮难的,断词後再接回去可能比较容易10/18 08:32
其实量没有说太多,手动起来是还好
不过因为是论文想说能直接跑出来应该最好(?
2F:推 johnbill: 权重高高是多高? 加到9999看看?10/18 11:43
加到超级无敌高了也是一样哈哈,我在想应该是目标单字前後的单字也会影响断词结果,不
过这部分对代码新手的我实在就没办法了 囧
※ 编辑: TiffanyPany (60.96.185.59 日本), 10/18/2022 12:47:01
3F:→ lycantrope: 试试jeiba.suggest_freq("超前部署",True)? 10/18 13:07
感谢 刚刚加了快速看一下好像可以达成我想要的结果
非常感谢
※ 编辑: TiffanyPany (60.96.185.59 日本), 10/18/2022 13:55:21