作者A11 (血拼)
看板CodeJob
标题[发案] BBS抓取字串程式(用perl会不会比较容易?)
时间Fri Nov 14 09:00:58 2008
案件状态:发包中
发案人:我
联络方式1:站内信
有效时间:无
专案说明:
1.使用者输入看板名称、帐号、密码
2.登入并抓取ptt该看板内所有文章
3.搜寻所有文章内的发(修)文者IP、推文者IP
4.将IP、发文或推文者ID、文章编号、文章或推文内容存入excel档中
预算:请来信报价
接案者要求:请真的能完成的人来接案
在这边遇到好多做一半後说不会了的人
附注:
(以下内容鼓励结案後填写,可以询问接案人愿不愿意暴光接案身份)
结案意见:
接案人:
评价(0-10):
说明:
※ 编辑: A11 来自: 211.74.12.67 (11/14 09:04)
1F:推 gush0905:HI~我有兴趣~可不可以把之前别人的SOURCE CODE 给我呢? 11/14 10:10
2F:→ gush0905:或者提供一下别人的作法 11/14 10:10
3F:推 yanli2:PTT不是有web版? 11/14 11:00
4F:→ TonyQ:以前就做过类似的东西了 :p 11/14 12:23
5F:→ TonyQ:不过以前是做Query站上所有使用者的id/来源ip建档...抓分身 11/14 12:23
6F:→ TonyQ:这个问题麻烦的不在浏览 , 而是在识别的pattern. 11/14 12:24
7F:→ TonyQ:以及因为外在因素而使得连线中断时 , 资料要怎麽处理. :p 11/14 12:25
8F:→ TonyQ:以这个问题来讲我会开不低的价 , 要捞出ip pattern , 还要 11/14 12:26
9F:→ TonyQ:做各种资料的切块 , 再加上浏览所有资料本身的工 , 11/14 12:26
10F:→ TonyQ:跟其他的东西比起来 , 这没有个四五万是不会有人想做的. 11/14 12:27
11F:→ TonyQ:之前有做过某组屋网 web介面界接bbs bot发表到某站租屋版 , 11/14 12:28
12F:→ TonyQ:单就这功能就收入整整15k左右...:p 11/14 12:28
13F:→ TonyQ:而且这收入还不算多 , 你真的会想砸钱在这些资料上吗? 11/14 12:29
14F:→ TonyQ:btw 至於作法 , 其实就非常单纯 , 开个socket 接到bbs去 , 11/14 12:32
15F:→ TonyQ:然後送讯息收讯息 , 纯文字 , 除了控制码的* 要改esc (0x1b) 11/14 12:34
16F:→ TonyQ:enter 改送 crlf , 至於上下左右的操作有一个pattern 11/14 12:35
17F:→ TonyQ:是两个ascii的组合键 , 程式不在手边突然想不起来是哪些.:p 11/14 12:35
18F:→ TonyQ:虽然说原理实在是不难 , 但是很费工 , 加上门槛高. :p 11/14 12:36
19F:推 appleboy46:囧 Tony 兄 可以回一篇文章了啦 11/14 13:04
20F:推 yoco315:我也觉得这个要做起来不便宜.. 直接抓 web 简单多了 11/14 13:12
21F:推 pfory:有人都写好,源码都放在网路上让人下载了... 11/14 14:19
22F:推 bigair:楼上,愿闻其详 :P 11/14 15:30
23F:推 wawawa:楼上...要善用 google 阿...:p 11/14 19:28
24F:推 chweng:楼上...至少也给个关键字好吗...:p 我猜是 PHP Telnet? 11/14 22:46
25F:推 bigair:我只知道用 ztelnet 去改写 bbs bot 啊 0rz 11/14 23:43
26F:→ TonyQ:最接近的大概是 bbs to html 的backup程式吧 , 11/15 21:22
27F:→ TonyQ:就算是这样 , 离原作者要的东西还是有一段加工啊... 11/15 21:22
28F:→ TonyQ:这个工的麻烦在於, 把一大片的具有特定syntax纯文字转成有 11/15 21:23
29F:→ TonyQ:系统的资料 ... 真的有程式已经做了这些分析吗? :p 11/15 21:23
30F:推 pfory:再加点油,你还没google我说的程式... 11/15 21:58
31F:推 vizshala:这东西用regular expression来做简单又快 11/15 22:01
32F:→ TonyQ:pfory , 何不来个关键字? :p 11/15 22:27
33F:推 a9:PTT 抓取 11/15 22:58
35F:→ TonyQ:所说得东西, 它还不够理想 , 有别的吗? :p 11/15 23:59
36F:→ idleidle:楼上的东西还不错~~谢拉! 11/19 16:26
37F:推 antontw:这算高门槛吗? 11/20 22:36
38F:→ TonyQ:以8000~20000可以找的人才中 , 算很高门槛.:p 11/21 14:30
39F:推 jgboy:丁丁贝壳??? 11/25 22:37
41F:→ iapptt:最高能够有多少报酬?需要GUI吗?原始码?手册?平台为何? 02/05 23:11