作者Bidoll ( .)
站内Wikipedia
标题Re: [问题] 维基百科可以下载吗??
时间Sun Oct 22 14:22:14 2006
※ 引述《alexsh (Lin4h)》之铭言:
: http://download.wikimedia.org/
: http://download-yaseo.wikimedia.org/ (ja,ko,th,ms四种语言)
: 下载的是从资料库解出来、以XML整合後再压缩的档。(还包括含历史记录,不含记录,
: 文章标题清单…等等(个人登录资料也有,不过不给下)
: 重点来了:现阶段,你要自己架MediaWiki才能Import这些资料。
: 方法在这里(http://0rz.net/361SB)
借个标题问一下...
目前我们实验室有需求需要做一个几乎是 Mirror 的站台...
若是照上述前辈所提供的方法的话..这样子做下来..时间与人力不敷成本..
因为研二学长的国科会计画与大学部的毕业专题..都需要用到 Wikipedia 的东西...
国科会计画 - 利用维基百科词条具有各种语言翻译及定义的特性,
将其功能利用C#语言撰写成DLL函式库,亦即维基外覆程式,
让使用者能够利用维基外覆程式达到跨语言的语料收集,我们写了
一套 API 将维基外覆程式的功能以图形介面呈现供使用者操作,
另外我们也提供 Web service 让使用者透过简易的URL 便能够使用
维基外覆程式提供的功能,将维基外覆程式实际应用在跨语言资讯检索上。
毕业专题 - 概念是..目前 Wikipedia 搜寻出来的结果没有经过排序...
学弟目前是计画做一个 Ranking 排序的动作 ( 类似於Goole搜寻完的结果 )
(这是从我老板那听来的..细节不大清楚)
所以...我目前是已经有架设好一个 MediaWiki 站台...
为了学弟的专题,跟学长的Demo能顺利...
因为连到英文站时,在速度上会有点小慢....
所以才希望自己能 Mirror 回来使用...
但因为我的架站的经验不足,不知道怎麽去动作比较省时、省事...
所以想上来问一下有没有前辈已经有 Mirror 过的经验,可以指导一下..
PS:我们老板还希望能够把 Import 进资料库的资料...
能还原成网页跟连去 Wikipedia 看到的东西一样...
我也正头痛这一点....
先感谢板友们您的阅读,有点落落长...
希望不会担误到大家的时间..
期待能激发一些好的 Idea 与经验传承
先谢谢各位前辈的回答了 ^^"
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 163.17.10.250