作者Bidoll ( .)
站內Wikipedia
標題Re: [問題] 維基百科可以下載嗎??
時間Sun Oct 22 14:22:14 2006
※ 引述《alexsh (Lin4h)》之銘言:
: http://download.wikimedia.org/
: http://download-yaseo.wikimedia.org/ (ja,ko,th,ms四種語言)
: 下載的是從資料庫解出來、以XML整合後再壓縮的檔。(還包括含歷史記錄,不含記錄,
: 文章標題清單…等等(個人登錄資料也有,不過不給下)
: 重點來了:現階段,你要自己架MediaWiki才能Import這些資料。
: 方法在這裡(http://0rz.net/361SB)
借個標題問一下...
目前我們實驗室有需求需要做一個幾乎是 Mirror 的站台...
若是照上述前輩所提供的方法的話..這樣子做下來..時間與人力不敷成本..
因為研二學長的國科會計畫與大學部的畢業專題..都需要用到 Wikipedia 的東西...
國科會計畫 - 利用維基百科詞條具有各種語言翻譯及定義的特性,
將其功能利用C#語言撰寫成DLL函式庫,亦即維基外覆程式,
讓使用者能夠利用維基外覆程式達到跨語言的語料收集,我們寫了
一套 API 將維基外覆程式的功能以圖形介面呈現供使用者操作,
另外我們也提供 Web service 讓使用者透過簡易的URL 便能夠使用
維基外覆程式提供的功能,將維基外覆程式實際應用在跨語言資訊檢索上。
畢業專題 - 概念是..目前 Wikipedia 搜尋出來的結果沒有經過排序...
學弟目前是計畫做一個 Ranking 排序的動作 ( 類似於Goole搜尋完的結果 )
(這是從我老闆那聽來的..細節不大清楚)
所以...我目前是已經有架設好一個 MediaWiki 站台...
為了學弟的專題,跟學長的Demo能順利...
因為連到英文站時,在速度上會有點小慢....
所以才希望自己能 Mirror 回來使用...
但因為我的架站的經驗不足,不知道怎麼去動作比較省時、省事...
所以想上來問一下有沒有前輩已經有 Mirror 過的經驗,可以指導一下..
PS:我們老闆還希望能夠把 Import 進資料庫的資料...
能還原成網頁跟連去 Wikipedia 看到的東西一樣...
我也正頭痛這一點....
先感謝板友們您的閱讀,有點落落長...
希望不會擔誤到大家的時間..
期待能激發一些好的 Idea 與經驗傳承
先謝謝各位前輩的回答了 ^^"
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 163.17.10.250