作者A11 (血拼)
看板CodeJob
標題[發案] BBS抓取字串程式(用perl會不會比較容易?)
時間Fri Nov 14 09:00:58 2008
案件狀態:發包中
發案人:我
聯絡方式1:站內信
有效時間:無
專案說明:
1.使用者輸入看板名稱、帳號、密碼
2.登入並抓取ptt該看板內所有文章
3.搜尋所有文章內的發(修)文者IP、推文者IP
4.將IP、發文或推文者ID、文章編號、文章或推文內容存入excel檔中
預算:請來信報價
接案者要求:請真的能完成的人來接案
在這邊遇到好多做一半後說不會了的人
附註:
(以下內容鼓勵結案後填寫,可以詢問接案人願不願意暴光接案身份)
結案意見:
接案人:
評價(0-10):
說明:
※ 編輯: A11 來自: 211.74.12.67 (11/14 09:04)
1F:推 gush0905:HI~我有興趣~可不可以把之前別人的SOURCE CODE 給我呢? 11/14 10:10
2F:→ gush0905:或者提供一下別人的作法 11/14 10:10
3F:推 yanli2:PTT不是有web版? 11/14 11:00
4F:→ TonyQ:以前就做過類似的東西了 :p 11/14 12:23
5F:→ TonyQ:不過以前是做Query站上所有使用者的id/來源ip建檔...抓分身 11/14 12:23
6F:→ TonyQ:這個問題麻煩的不在瀏覽 , 而是在識別的pattern. 11/14 12:24
7F:→ TonyQ:以及因為外在因素而使得連線中斷時 , 資料要怎麼處理. :p 11/14 12:25
8F:→ TonyQ:以這個問題來講我會開不低的價 , 要撈出ip pattern , 還要 11/14 12:26
9F:→ TonyQ:做各種資料的切塊 , 再加上瀏覽所有資料本身的工 , 11/14 12:26
10F:→ TonyQ:跟其他的東西比起來 , 這沒有個四五萬是不會有人想做的. 11/14 12:27
11F:→ TonyQ:之前有做過某組屋網 web介面界接bbs bot發表到某站租屋版 , 11/14 12:28
12F:→ TonyQ:單就這功能就收入整整15k左右...:p 11/14 12:28
13F:→ TonyQ:而且這收入還不算多 , 你真的會想砸錢在這些資料上嗎? 11/14 12:29
14F:→ TonyQ:btw 至於作法 , 其實就非常單純 , 開個socket 接到bbs去 , 11/14 12:32
15F:→ TonyQ:然後送訊息收訊息 , 純文字 , 除了控制碼的* 要改esc (0x1b) 11/14 12:34
16F:→ TonyQ:enter 改送 crlf , 至於上下左右的操作有一個pattern 11/14 12:35
17F:→ TonyQ:是兩個ascii的組合鍵 , 程式不在手邊突然想不起來是哪些.:p 11/14 12:35
18F:→ TonyQ:雖然說原理實在是不難 , 但是很費工 , 加上門檻高. :p 11/14 12:36
19F:推 appleboy46:囧 Tony 兄 可以回一篇文章了啦 11/14 13:04
20F:推 yoco315:我也覺得這個要做起來不便宜.. 直接抓 web 簡單多了 11/14 13:12
21F:推 pfory:有人都寫好,源碼都放在網路上讓人下載了... 11/14 14:19
22F:推 bigair:樓上,願聞其詳 :P 11/14 15:30
23F:推 wawawa:樓上...要善用 google 阿...:p 11/14 19:28
24F:推 chweng:樓上...至少也給個關鍵字好嗎...:p 我猜是 PHP Telnet? 11/14 22:46
25F:推 bigair:我只知道用 ztelnet 去改寫 bbs bot 啊 0rz 11/14 23:43
26F:→ TonyQ:最接近的大概是 bbs to html 的backup程式吧 , 11/15 21:22
27F:→ TonyQ:就算是這樣 , 離原作者要的東西還是有一段加工啊... 11/15 21:22
28F:→ TonyQ:這個工的麻煩在於, 把一大片的具有特定syntax純文字轉成有 11/15 21:23
29F:→ TonyQ:系統的資料 ... 真的有程式已經做了這些分析嗎? :p 11/15 21:23
30F:推 pfory:再加點油,你還沒google我說的程式... 11/15 21:58
31F:推 vizshala:這東西用regular expression來做簡單又快 11/15 22:01
32F:→ TonyQ:pfory , 何不來個關鍵字? :p 11/15 22:27
33F:推 a9:PTT 抓取 11/15 22:58
35F:→ TonyQ:所說得東西, 它還不夠理想 , 有別的嗎? :p 11/15 23:59
36F:→ idleidle:樓上的東西還不錯~~謝拉! 11/19 16:26
37F:推 antontw:這算高門檻嗎? 11/20 22:36
38F:→ TonyQ:以8000~20000可以找的人才中 , 算很高門檻.:p 11/21 14:30
39F:推 jgboy:丁丁貝殼??? 11/25 22:37
41F:→ iapptt:最高能夠有多少報酬?需要GUI嗎?原始碼?手冊?平台為何? 02/05 23:11