作者SODAECHO1 (sily)
看板CodeJob
标题[发案] 收集无名帐号~(已成案)
时间Sat Aug 14 13:36:02 2010
案件状态:已成案
发案人:silly
联络方式1:站内信
有效时间:越快越好
专案说明:无名帐号不重复名单350万笔↑
预算:1.5w
接案者要求:都可以
接受新手承案否:没意见
附注:一定是要是不重复的无名帐号名单,纪录方法是
使用记事本纪录!
例:
i25622
c25712
t25123
(350万笔不重复名单)
我相信懂程式的可以使用软体自动抓取无名帐号名单
(就像是自动收集Mail软体一样)
目前需要350万笔不一样的帐号名单!
当然有能力的人也可以收集更多名单 500万↑
有问题在站内信给我吧!感谢
(以下内容鼓励结案後填写,可以询问接案人愿不愿意暴光接案身份)
结案意见:
接案人:
评价(0-10):
说明:
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 111.252.40.253
现在是8/14 下午5点
蛮多人愿意接这个案子的 (至少10人)
让我不知道怎麽选择 ! 有站内信给我的 我都会回复
站内信尽量告诉我大家的优势 我相信这个板上很多人才 感谢大家^^
※ 编辑: SODAECHO1 来自: 111.252.40.253 (08/14 17:08)
已经找到人做了^^" 感谢大家来信
往後也许还会有类似的案件 在上来找大家帮忙吧 感谢!
※ 编辑: SODAECHO1 来自: 111.252.40.253 (08/14 19:21)
1F:推 yanli2:直接帮你写程式让你自己抓? 08/15 02:00
2F:→ jlovet:楼上,这样怎麽知道到底抓了多少,一边说可以抓一千万 08/15 02:10
3F:→ jlovet:一边说我只抓到一千 08/15 02:10
4F:推 pfory:程式抓不难,但是很容易没几笔就被锁IP了 08/15 09:14
5F:推 WolfLord:配合多张网卡与拨号程式应该可解 08/15 10:02
6F:→ superpai:无名真正有在使用的ID有没有1百万都不知道@@ 08/15 10:10
7F:→ LewisHamiltn:重点是速度..案主好像很急 我昨天开程式抓几个小时 08/15 10:33
8F:→ LewisHamiltn:也不过几万笔 要350万看来要多机器+map reduce.. 08/15 10:33
9F:推 makiyolove:我抓到2W5就被999了ˊˋ 08/15 11:32
10F:推 abcabcabc:1台机器就可以了 多线程 同时每个给不同表头 08/15 14:20
11F:→ abcabcabc:必要时定期切ip 我以前看过网路上有人有写 08/15 14:21
12F:→ abcabcabc:大概10多分钟可以抓百万笔左右 08/15 14:21
13F:推 WolfLord:不要看我,不是我....(逃) 08/15 20:21
14F:→ slalala:各位请教一下 如果像Java HttpClient4同instance做request 08/15 20:43
15F:→ slalala:一样也会出现999吗??(具体观念意思是同一session) 08/15 20:43
16F:推 WolfLord:那个重点在於伺服端怎麽指认你,而你要如何不让对方辨识 08/15 20:59
17F:→ stdlib:有前辈可以提供些关键字吗,我也想试着处理这类问题,谢谢! 08/15 21:32
18F:→ TonyQ:http client / proxy / html parser / crawler 08/15 21:42
19F:→ TonyQ:扯到 wolf 讲的东西的话,可能会需要再加上route/pppoe 08/15 21:43
20F:推 abcabcabc:999是被yahoo买下之後才会有的新计俩吧? 08/15 22:20
21F:→ abcabcabc:tony讲的都关键字 proxy的话 至少我以前试简单切proxy法 08/15 22:22
22F:→ abcabcabc:对加了999後的yahoo没效果 他发现了我的阴谋 得再加料? 08/15 22:23
23F:推 WolfLord:先思考一下:IE连上去後会回报什麽,以及SERVER会到什麽 08/16 02:39
24F:→ WolfLord:然後你能够变动什麽?这样仔细想想自然发现他拿什麽指认 08/16 02:39
25F:→ WolfLord:而你也可以拿什麽呼楞对方..... 08/16 02:40
26F:推 aadean:有意思..但来源ip有辨法用程式修改吗? 08/16 11:02
27F:推 Marty:楼上 用proxy.... 08/16 12:34
28F:推 WolfLord:一般OPEN PROXY都会被列入黑名单,用PROXY很难躲的。除非 08/16 23:53
29F:→ WolfLord:放蛊攻占殭屍堡垒,不过这样是违法的。但是ADSL帐号烂掉 08/16 23:54
30F:→ WolfLord:就烂掉,你目标达到就好....所以最佳解是多张网卡勤换IP 08/16 23:55
31F:→ runtime:我以前抓过 手上应该不只350万 我是WARM的作者 请来信恰谈 08/20 00:54
32F:推 runtime:你们都想太多了 其实无名有Bug可以跳过999 08/20 11:05
33F:推 runtime:三年前的Bug没想到留到现在还在...XD 08/20 11:07
34F:→ runtime:可以思考看看 什麽东西很频繁存取 却又不会被挡下来 08/20 11:07
35F:→ TonyQ:真的假的 这也太帅了 XD 08/21 18:51
36F:推 wansincere:这真的是不错的课题 感谢分享 09/01 17:14
37F:推 xxxx9659:频繁存取 却又不会被挡下来 蜘蛛人吗? 是吗是吗? 09/03 23:59
38F:→ hanbz:建立免洗新帐号? 09/14 06:03
39F:→ hanbz:还是透过yahoo的搜寻引擎去做网路蜘蛛? 09/14 06:04