作者MilchFlasche (sarang kua phieonghua)
看板PttSuggest
標題[建議] PTT有「搜尋引擎最佳化」的完整解決計畫嗎?
時間Thu Mar 15 14:23:53 2007
在
Gaaan:不只是網頁版PTT (Mr. 6)
http://mr6.cc/?p=598#comments
這篇的迴響當中,in2站長提到
「在 Google 裡面直接搜 site:webptt.com/m.aspx?n= 有 102k 筆, 並非爬不進去, 只是因為沒有外
部連進去所以 ranking 很低」
剛剛再試了一下,雖然可以搜到49萬筆,比in2站長說的還更多了,
但是不管是用Google或Yahoo!做這樣的網域限定搜尋,
效果還是不佳。
比方說我找「哈布斯堡」好了,光是historia板提到這個名字的文章,
少說也有十幾篇,但是Google只找得到一篇、Yahoo!好一點,三篇,
但其中兩個結果都是從別的看板來的。
所以,以現在Web介面的設計,光靠搜尋引擎的機器人們慢慢爬,
似乎離理想的全站全文搜尋還有一大段距離。
那另一個方法可能是透過PTT自己在Web介面上做全站全文搜尋,
但如我在PttBug板上的回報一樣,Scupio的搜尋器壞很久了。
PTT是台灣第一大telnet BBS站,上面有這麼多有用的資訊,
如果一直沒有良好的全站全文搜尋機制,實在太可惜了。
不知道站方在這方面的相關技術和可行性上有沒有什麼評估和想法?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.194.226.31
1F:推 Skx:怎麼全站搜尋的建議又回娘家了 03/15 17:44
2F:推 lightsoldier:光是考量系統負擔就不可能了..Ptt 文章數多到這種程 03/15 18:01
3F:→ lightsoldier:度 六萬人在線上或 po 文或閱讀文章就快吃不消了 03/15 18:01
4F:→ lightsoldier:如果還有人要全站搜尋 應該十分鐘就會掛一次吧我猜 03/15 18:02
5F:推 nvfp:不然看估狗肯不肯借他們的蜘蛛一隻來ptt爬一下 03/15 21:12
6F:推 MilchFlasche:是,不好意思,相信這話題是老梗了。 03/16 07:34
7F:→ MilchFlasche:那再請教一下,所以靠PTT自己的伺服器做全站搜尋不可 03/16 07:34
8F:→ MilchFlasche:能囉?那有沒有辦法讓spider爬得更多更好一點呢? 03/16 07:35
9F:→ MilchFlasche:或者是PTT自己先做indexing,或是sitemap,可行嗎? 03/16 07:37
10F:推 nvfp:看估狗能不能給個需要的資料格式, 或送隻"減弱版"的來用 XD 03/16 12:29
11F:推 MilchFlasche:既然都已經dump到Web上了,搜尋功能卻這麼廢:( 03/17 09:13
12F:→ MilchFlasche:可不可以另外開個伺服器專作Web上的搜尋呢? 03/17 09:17
13F:→ nvfp:除非要得到很好的機器吧, 不然還是跟專業的要求支援較可能 03/18 23:26