作者ilay (说唱猜做玩)
看板Python
标题[闲聊] 这个要怎麽parse...
时间Wed Apr 18 09:16:43 2012
最近因为专案需求要取得某超商的门市位置资讯,所以找上了这个网站准备 parse..
http://emap.pcsc.com.tw/01.htm
打开後突然想到这东西不能用一般 parsing 静态页面的方式去做
他的关键资讯都要触发 javascript 事件後才会出现
所以不太懂要从哪边下手
不知道有没有神人做过类似的事情可以指点一下~感谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 163.29.98.120
1F:推 shaopin:用该网站的api 04/18 09:24
2F:→ ilay:不太懂@@ 愿闻其详 04/18 09:27
3F:推 shaopin:你看他网站src里的js都怎麽call xmlhttpreq 就照样 04/18 09:30
4F:→ ilay:原来如此! 04/18 09:43
5F:→ ilay:结果看不太懂他的东西 囧 04/18 10:23
6F:→ legnaleurc:用 Firebug 之类的看它 network request 04/18 13:06
7F:→ gozule:scrapy不知道能不能做到 04/18 19:53
8F:→ bob123:我用chrome的console下js指令可以抓到资料但是用python 04/19 02:17
9F:→ bob123:(urllib2,cookie,json) 送req他竟然回使用者权限不足... 04/19 02:21
10F:→ bob123:不试了,等高手解完再来学习Orz... 04/19 02:24