[问题] 请问爬虫 bs4的撷取方法?

时间Mon Jun 29 21:38:52 2020

如题目用原始码会是一片这样 logged_user = false; var static_id_cdn = 2; var html5player = new HTML5Player('html5video', '25522515'); if (html5player) { html5player.setVideoTitle('); html5player.setSponsors([{}]); html5player.setVideoUrlLoW........... 其实还满整齐的我所要的网址都摆在了html5player.setVideoUrlLow里面使用bs4是好选择吗?该如何操作? --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.220.255.143 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1593437935.A.94F.html

1^F：→ mychiux413: bs4不能解析js，如果re能抓出来就re吧，下策就seleni 06/30 00:03

2^F：→ mychiux413: um 06/30 00:03

3^F：→ alvinlin: 嗯。通常是去看js完後它把资料丢哪去了。然後去抓那个结 06/30 01:36

4^F：→ alvinlin: 果 06/30 01:36

5^F：→ alvinlin: 建议可以po个网址来看看省时间 06/30 01:37

6^F：推 aidansky0989: 请问碰到html会先用xpath还是bs4？两个不太会选 07/01 08:25

7^F：→ alvinlin: bs4有css也有xpath.如果用parsel(scrapy)只有xpath.所以 07/01 13:26

8^F：推 alvinlin: bs4有个参数有html.parser/lxml/html5lib但只是速度不同 07/01 13:29

9^F：→ alvinlin: 或你也可以用html.parser模组的HTMLParser类自己刻一个 07/01 13:32

10^F：→ alvinlin: 或用html2text模组不parse自己去找内容 07/01 13:35

11^F：→ alvinlin: 所以bs4和xpath不是对比的选择.而是xpath是bs4的选项之1 07/01 13:40

12^F：→ alvinlin: bs4不能解析js是因为js需要浏览器才能跑(除非是node.js) 07/01 13:42

13^F：→ OrzOGC: 我都爬出来找,xpath直接放弃...XD 07/01 15:01

14^F：推 aidansky0989: 感谢大大解答 07/01 15:20

15^F：→ alvinlin: ^^ 07/06 23:24

16^F：→ alvinlin: 如果还是说明不清楚可以说 07/06 23:25

17^F：→ alvinlin: 通常是css和xpath混用吧看哪一个可以达到目标 07/06 23:29

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Python 板

[问题] 请问爬虫 bs4的撷取方法?

热门看板

赞助商连结