[问题] 爬虫 Google search

时间Tue Jun 9 11:25:13 2020

请问一下再拿到 response 後用 tag 去找资料会失败为什麽我执行的时候很容易失败 https://i.imgur.com/xs0Hu1x.jpg 偶尔会成功 https://i.imgur.com/LF6VOjR.jpg 我 header 放 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36' 请问有人有遇到过这样的问题吗? 我後来把 cookie 也全部加进去也没效 QQ --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.125.46.7 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1591673115.A.586.html

1^F：→ pmove: 失败时，回传的资料是？ 06/09 12:22

2^F：→ mychiux413: 找看看有没有'recaptcha'的id,有的话就是机器人在挡 06/09 12:30

3^F：→ mychiux413: 爬google的所有动作最好是每5秒动一次比较安全 06/09 12:31

4^F：→ mychiux413: 如果recaptcha跳出来,可以休息10分钟後再来 06/09 12:32

5^F：→ yoz4ni: 回传的资料如果是找 tag 的话是没资料的(空的) 06/09 14:55

6^F：→ yoz4ni: 请问是 recaptcha 的话要在哪里才能看的到呢? 06/09 14:56

7^F：推 alvinlin: 用https://opendata.cwb.gov.tw/index 06/09 15:54

8^F：→ alvinlin: https://i.imgur.com/FlRV1Na.jpg 06/09 15:54

9^F：→ alvinlin: 另Google Custom Search API 也参考 06/09 15:59

10^F：→ alvinlin: 有API用API吧。爬东西很累人的 06/09 15:59

11^F：→ mychiux413: 会有一个element的id叫做'recaptcha', 可以用bs4找 06/09 16:05

12^F：→ alvinlin: 找到recaptcha也没用。破解不了的 06/09 16:22

13^F：→ OrzOGC: 一个人硬干是赢不过google那些工程师的 06/09 18:00

14^F：→ yoz4ni: 因为我是在练习，所以想说不去用 API 来抓资料看看 06/10 02:24

15^F：→ yoz4ni: 还是说这样的练习其实是不需要的OAO 06/10 02:24

16^F：→ yoz4ni: 我晚点去把回传资料找看看有没有 id 是 recaptcha 的 06/10 02:26

17^F：→ alvinlin: 也不是这样说。因为看你已经正确抓到资料了，所以你的程 06/10 03:13

18^F：→ alvinlin: 式没问题。但你如果是要去对付reCaptcha这我试过没找到 06/10 03:13

19^F：→ alvinlin: 方法。所以你只能绕道。刚好这个有API那应该试着用其他 06/10 03:13

20^F：→ alvinlin: 方法取得资料，而不是和它硬干。 06/10 03:13

21^F：→ alvinlin: https://i.imgur.com/PxU7cb6.jpg 06/10 03:20

22^F：→ vi000246: 通常google有api的东西就不要自己爬了赢不了google工程 06/10 09:07

23^F：→ vi000246: 师的 06/10 09:07

24^F：→ shadowjohn: 爬的内容你连续多抓几个分页频率一高就被档了 06/10 09:26

25^F：推 femlro: 我有时候手动搜寻快一点都被挡了何况爬虫 06/10 16:26

26^F：推 aidansky0989: 只有更新cookies还不够，IP时间等等都要调 06/10 16:35

27^F：→ salmon12706: 工研院人工智慧课程推荐https://reurl.cc/4RDRaK 06/29 16:15

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Python 板

[问题] 爬虫 Google search

热门看板

赞助商连结