作者MilchFlasche (sarang kua phieonghua)
看板PttSuggest
标题[建议] PTT有「搜寻引擎最佳化」的完整解决计画吗?
时间Thu Mar 15 14:23:53 2007
在
Gaaan:不只是网页版PTT (Mr. 6)
http://mr6.cc/?p=598#comments
这篇的回响当中,in2站长提到
「在 Google 里面直接搜 site:webptt.com/cn.aspx?n= 有 102k 笔, 并非爬不进去, 只是因为没有外
部连进去所以 ranking 很低」
刚刚再试了一下,虽然可以搜到49万笔,比in2站长说的还更多了,
但是不管是用Google或Yahoo!做这样的网域限定搜寻,
效果还是不佳。
比方说我找「哈布斯堡」好了,光是historia板提到这个名字的文章,
少说也有十几篇,但是Google只找得到一篇、Yahoo!好一点,三篇,
但其中两个结果都是从别的看板来的。
所以,以现在Web介面的设计,光靠搜寻引擎的机器人们慢慢爬,
似乎离理想的全站全文搜寻还有一大段距离。
那另一个方法可能是透过PTT自己在Web介面上做全站全文搜寻,
但如我在PttBug板上的回报一样,Scupio的搜寻器坏很久了。
PTT是台湾第一大telnet BBS站,上面有这麽多有用的资讯,
如果一直没有良好的全站全文搜寻机制,实在太可惜了。
不知道站方在这方面的相关技术和可行性上有没有什麽评估和想法?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 123.194.226.31
1F:推 Skx:怎麽全站搜寻的建议又回娘家了 03/15 17:44
2F:推 lightsoldier:光是考量系统负担就不可能了..Ptt 文章数多到这种程 03/15 18:01
3F:→ lightsoldier:度 六万人在线上或 po 文或阅读文章就快吃不消了 03/15 18:01
4F:→ lightsoldier:如果还有人要全站搜寻 应该十分钟就会挂一次吧我猜 03/15 18:02
5F:推 nvfp:不然看估狗肯不肯借他们的蜘蛛一只来ptt爬一下 03/15 21:12
6F:推 MilchFlasche:是,不好意思,相信这话题是老梗了。 03/16 07:34
7F:→ MilchFlasche:那再请教一下,所以靠PTT自己的伺服器做全站搜寻不可 03/16 07:34
8F:→ MilchFlasche:能罗?那有没有办法让spider爬得更多更好一点呢? 03/16 07:35
9F:→ MilchFlasche:或者是PTT自己先做indexing,或是sitemap,可行吗? 03/16 07:37
10F:推 nvfp:看估狗能不能给个需要的资料格式, 或送只"减弱版"的来用 XD 03/16 12:29
11F:推 MilchFlasche:既然都已经dump到Web上了,搜寻功能却这麽废:( 03/17 09:13
12F:→ MilchFlasche:可不可以另外开个伺服器专作Web上的搜寻呢? 03/17 09:17
13F:→ nvfp:除非要得到很好的机器吧, 不然还是跟专业的要求支援较可能 03/18 23:26