作者Huangs (Hi-End 精神)
看板Database
标题Re: [SQL ] 中文断句
时间Fri Dec 12 16:14:22 2008
※ 引述《savealone (嘴炮马)》之铭言:
: 我们做类似搜循引擎的系统,有做全文检索
: 在处理英文关键字时,断句都能顺利找到符合的资料
: 但处理中文关键句时,因为断句的关系,并没有找到所有应该列出的资料
: 例如,搜寻"资料"只会找出刚好满足"资料"的结果
: 但不会列出"资料库"的搜查结果
: 但搜"资料库"列出的查询结果则不相同
: 请问版上的神人有不一样的解法,或是介绍好用的插件
第一,这根本不是「断句」的问题,也不是「断词」的问题,你只是要全文检索而已。
第二,如果用 SQL 的话,那像板友的推文所说,用 LIKE '%资料%' 就可以找到
所有包含「资料」的项目。
第三,但看起你要做的是 search engine,难道 search engine 是用 SQL 做的吗?
这样会非常慢,尤其是 LIKE '%something%' 这种语法,
非常慢,要 linear time,也无法透过建立 index 改善。
或许你要重新思考是否使用 SQL 作 "search engine"。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.31.73
※ 编辑: Huangs 来自: 140.112.31.73 (12/12 16:15)
1F:推 xam:强 12/12 23:22