作者umziehen ()
看板Python
标题[问题] 爬虫新手:想抓的资讯不在html原始码里
时间Sat Mar 30 14:02:57 2019
大家好
我想学习爬虫和网页的基础知识
想实作的例子是透过程式抓下律师公会网站上
所有的律师姓名、事务所名、事务所电话的资讯
可是以台北律师公会的网站来说
这三项资讯似乎没有直接出现在html档里?
ex:以
https://member.tba.org.tw/FindLawyerDetail?LawyerId=6669为例
"馥咏德章"并没有直接出现在html档里
请问如果我想完成我的实作
我所需要的网页知识(只了解html语法够不够?)以及library(Beautiful Soup?)是?
有没有推荐的tutorial、影片可以参考?
非常感谢大家!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.137.22.203
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1553925779.A.596.html
2F:→ f496328mm: 以後可以去这里找 03/30 14:57
3F:推 windclara: 学会Chrome的F12功能! 03/30 15:23
※ 编辑: umziehen (114.137.22.203), 03/30/2019 15:27:13
※ 编辑: umziehen (114.137.22.203), 03/30/2019 15:29:32
4F:推 chaotic0307: 买网路爬虫实战书或是youtube看大数学堂的课就会了 03/31 01:12
5F:推 a11780922: ajax 03/31 17:30