作者autumned (autumned)
看板Python
标题[问题] 得知html的某element id ?
时间Sun Dec 4 22:02:22 2011
如题,想要抓的网站超连结的URL不是固定的
是用一些encoding之後有点随机决定的网址
打开原始码之後可看到最重要的这两行
document.getElementById("TheImg").src =
"
http://img"+sid+".8comic.com/"+did+"/"+itemid+"/"+num+"/"+img+".jpg";
我在Google chrome JavaScript console里面
只要输入
document.getElementById("TheImg").src
就可以看到他的值 也就知道要抓的页面的网址
我在用python抓网站时 parse後 发现我需要得知这个值(没有直接写在原始码里)
但是不知道怎麽办 请问有办法吗@@
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.166.108.140
1F:→ autumned:我有看了urllib2 beautifulsoup之类的 12/04 22:02
2F:→ autumned:但是看起来都只是帮忙parse , 这个感觉必须真的去 12/04 22:03
3F:→ autumned:Query这个值? 12/04 22:03
4F:→ suzuke:如果方便的话给出网站或许比较容易有解答 12/04 23:24
view-source:
http://www.8comic.com/love/drawing-233.html?ch=2-9
想要的网址其实就是 document.getElementById("TheImg").src 的值
这个CASE其实可以自己抓下原始码之後去算啦...可是假如
不知道他的值是怎麽算出来的怎麽办@@
※ 编辑: autumned 来自: 218.166.108.140 (12/05 00:00)
5F:→ timTan:codes 这个javascript 内的变数可以拿来运用啊。 12/06 01:26