作者qerter (研究僧)
看板Database
标题Re: [SQL ] 中文断句
时间Sat Dec 20 22:10:37 2008
※ 引述《Huangs (Hi-End 精神)》之铭言:
: ※ 引述《savealone (嘴炮马)》之铭言:
: 第一,这根本不是「断句」的问题,也不是「断词」的问题,你只是要全文检索而已。
: 第二,如果用 SQL 的话,那像板友的推文所说,用 LIKE '%资料%' 就可以找到
: 所有包含「资料」的项目。
: 第三,但看起你要做的是 search engine,难道 search engine 是用 SQL 做的吗?
: 这样会非常慢,尤其是 LIKE '%something%' 这种语法,
: 非常慢,要 linear time,也无法透过建立 index 改善。
: 或许你要重新思考是否使用 SQL 作 "search engine"。
若要做搜索引擎,可以考虑参考资讯检索的书籍
这本是我们的教科书
"Modern Information Retrieval" by Baeza-Yates & Ribeiro-Neto, Addison Wesley,
1999
给你参考一下 ....
--
跟着自由软体一起成长
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.127.220.219