作者autumned (autumned)
看板Python
標題[問題] 得知html的某element id ?
時間Sun Dec 4 22:02:22 2011
如題,想要抓的網站超連結的URL不是固定的
是用一些encoding之後有點隨機決定的網址
打開原始碼之後可看到最重要的這兩行
document.getElementById("TheImg").src =
"
http://img"+sid+".8comic.com/"+did+"/"+itemid+"/"+num+"/"+img+".jpg";
我在Google chrome JavaScript console裡面
只要輸入
document.getElementById("TheImg").src
就可以看到他的值 也就知道要抓的頁面的網址
我在用python抓網站時 parse後 發現我需要得知這個值(沒有直接寫在原始碼裡)
但是不知道怎麼辦 請問有辦法嗎@@
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.166.108.140
1F:→ autumned:我有看了urllib2 beautifulsoup之類的 12/04 22:02
2F:→ autumned:但是看起來都只是幫忙parse , 這個感覺必須真的去 12/04 22:03
3F:→ autumned:Query這個值? 12/04 22:03
4F:→ suzuke:如果方便的話給出網站或許比較容易有解答 12/04 23:24
view-source:
http://www.8comic.com/love/drawing-233.html?ch=2-9
想要的網址其實就是 document.getElementById("TheImg").src 的值
這個CASE其實可以自己抓下原始碼之後去算啦...可是假如
不知道他的值是怎麼算出來的怎麼辦@@
※ 編輯: autumned 來自: 218.166.108.140 (12/05 00:00)
5F:→ timTan:codes 這個javascript 內的變數可以拿來運用啊。 12/06 01:26