作者b6s (b6s)
看板Wikipedia
标题Re: [情报] 维基百科全文搜索引擎 (日)
时间Sun Apr 2 01:49:40 2006
http://nutch.taipedia.info/
这是用
http://lucene.apache.org/nutch/ 做的,底层是 Lucene。
目前是 demo 性质,所以可能只有首页上出现的字才查得到。
整个中文维基大概要跑一天才抓得完,届时再通知。
搜寻结果页面上显示的都是简体,但查询时通常无此限制。时间有限,多多包涵。^^;
我同时也在测 Indri,但它的 web interface 比较难搞。
另外也可以直接写个小页面来用 Lucene,不要经过 Nutch。
但目前手边能够以最短时间建置起来的大概只有 Nutch,就先这样。
如果觉得很慢,那是我的 ADSL 和 P3 1.266G 的问题......
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 59.105.131.104
1F:推 pektiong:可以有Holopedia版的搜寻引擎吗? 04/02 09:33
2F:推 b6s:当然可以,我做好会再通知。 04/03 00:57
4F:推 jnlyu:搜寻出来是乱码 04/03 12:44
5F:推 b6s:jnlyu: 请问您用什麽 browser? os? 用什麽关键字查? 谢谢 04/03 13:03