作者banco (Acoustic)
看板Wikipedia
標題Re: [轉錄] 維基百科1月7日推出搜索引擎
時間Sat Dec 29 01:55:22 2007
※ 引述《fuzuki ()》之銘言:
: : 開發源代碼搜索專案是為最終用戶提供更透明的搜索結果
: : 該wikia搜索專案已組裝了基本的搜索引擎技術,包括搜索應用程式、搜索演算法和
: : Web Crawler。該專案將讓技術愛好者以維基百科的社區模式幫助過濾網站和排名搜索結
: : 果。
: : 我們的構想是通過提供搜索服務為最終用戶提供更透明的搜索結果,來挑戰當前的搜
: : 索引擎運營者,即用戶可以看到搜索結果是如何得出的。威爾斯描述了雅虎與谷歌不透明
: : 的服務,其並沒有解釋其搜索結果是如何得出的。
: 報導重點:
: 這是一個Wikia 底下的一個 opensource專案,
: 讓技術人員以類似維基百科協作的方式修正搜尋結果。
: 我努力看懂就是如此,真的是不是這樣是另一回事。
我猜想搜索結果的"解釋",
應該是指使用者輸入的關鍵字, 與網頁排名之間的數學關係
關鍵字 <--- ???? 某種方法 ???? ---> 網頁1 網頁2 .....
威爾斯稱 google 和 yahoo 搜尋結果不透明,
應該指的是使用者無法得知他們是採用哪種演算方式
若將搜尋引擎演算法透明化, 技術人員可以測試搜尋演算法的優劣
當發現有不足之處, 可以進一步地去增強既有的演算法
之前有先進介紹的詞頻-反詞頻, 即為演算方式的其中一種
搜尋引擎大多是依憑這種統計方法來進行資料探勘
詞頻-反詞頻算是較為基本的方法, 複雜一點要去計算網頁間的潛藏關係
或是如何將數個不同的網頁歸類為同一個大主題之下
當然, 由使用者評分也是可納入考量的方法之一
一般而言, 搜尋引擎不會單獨採用某種特定演算方法
而如何綜合各類方法所產生的搜尋結果也是門高深的學問
演算方法透明化, 等於提供一個網頁搜尋技術的測試平台
有興趣者自行撰寫演算法來測試自己想法的可行性
長遠來說, 公開這類演算方法對於搜尋結果絕對是有正面幫助的
但能不能達到像 google/yahoo 等搜尋引擎同等的效果還很難說
因為有些演算方法受專利保護, 不是想用就能用
但集眾人之志也是能架構出一個優秀的搜尋引擎
題外話, 我還挺想知道早期奇摩搜尋用什麼方法來搜尋
以"交大"為關鍵字搜尋, 排名第一的頁面是"口交大補帖"....
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.114.206.121
1F:推 fuzuki:我不是先進 希望明年可以進交大叫你一聲學長 12/29 03:05
2F:推 fuzuki: 清←更正 12/29 03:07