作者paiyuliu (萬里無雲)
看板Patent
標題[問題] 請問這樣的資料庫大既要多少錢呢?
時間Mon Aug 4 21:53:24 2008
各位晚安:
我是目前想利用專利來寫一些實證論文的小小研究生
而實證當然是需要大量的資料
而在USPTO網站上的資料原始檔(XML那些的)
我試著解析過那些檔,也了解到XML的格式
只是,非資工出身的我,要解析那些原始檔真的是一個很困難的事情
今天有跟連穎科技談了一下
後來好像就不了了之(沒回電)
我需要的資料為2003到2007年的
patent number,patent的所屬國家,patent的ISSUE DATE
以及這個patent number所引證的專利
我只需要這些欄位
連穎科技有稍微提過,去年他們賣最新的Raw Data就十幾萬
只是,我所需要的只是這幾個欄位,也不需要全部的資料
這樣還需要這麼貴嗎?
--
手邊只有5萬的國科會經費可以用
只是,老師跟博班學長好像視收集資料為基本工作
我看了一下,五年總共八十幾萬筆的資料
就算我慢慢Key in,也需要半年的時間啊!!! =.=
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.232.16.146
1F:推 eedavid:建議你找個資工的朋友幫您將XML資料匯進資料庫 08/04 22:08
2F:推 adrian0215:叫你老板寫個信到智慧局資服組 說不定有意想不到的結果 08/05 00:07
3F:推 piglauhk:XD 做好了 你大概也可以拿出來賣個錢了吧 嘿嘿 08/05 09:23
4F:推 yaerse:建議你可以發文到Code_Job問問.. 08/05 22:31
5F:→ yaerse:我程式沒很強..但是覺得不難..只要手邊已經有原始檔.. 08/05 22:32
6F:→ yaerse:就可以透過程式讀取XML的tage..然後將值存入資料庫 08/05 22:32
7F:推 adrian0215:發包給我吧 我寫PERL 08/05 22:38
8F:→ paiyuliu:y大!基本上我七月就一直在搞tag的問題 08/05 23:11
9F:→ paiyuliu:那tag用的真的很雜亂,一筆資料可以用到4~5個tag 08/05 23:12
10F:→ paiyuliu:a大!我再處理看看.真的不行我再連絡你!謝謝喔!好感動 08/05 23:13
11F:→ pttac:連穎不是有教育版可以買? 08/06 13:55
12F:→ pttac:如果你趕時間的話 我幫你撈 08/06 13:57
13F:→ LinusChen:小心被擋IP 偶被擋過了 XD 08/06 16:43
14F:推 forcomet:這東西看起來很有趣~如果ok了~可以分享嗎:p 08/06 22:17
15F:推 Kniveschou:perl很快上手 撈資料很簡單 不難 你可以自己做 08/06 23:21
16F:→ Kniveschou:跟老闆請錢把那五萬都拿走 說這外包五萬 以後無限制XD 08/06 23:21
17F:推 piglauhk:樓上這樣可能有刑法的問題..(至少找個人頭嘛) 08/07 12:13