作者yoco315 (眠月)
看板Python
标题Re: [问题] 抓 google 网页的搜寻回传结果
时间Sun Dec 16 04:02:58 2007
※ 引述《plom (plom)》之铭言:
: 刚又试了一下
: import httplib
: httplib.HTTPConnection.debuglevel = 1
: import urllib2
: opener = urllib2.build_opener()
: opener.addheaders = [('User-agent', 'Mozilla/5.0')]
: opener.open('http://www.google.com.tw/search?q=time&start=20&complete=1&hl=zh-TW&sa=N&btnG=%E6%90%9C%E5%B0%8B').read()
: 接下来要下什麽指令才能抓网页呢?
其实你上面已经抓到了啊
t = opener.open('
http://www.google.com.tw/...........')
print t
就可以看到结果了
我把你的码复制 try 过了没问题..
很确实的抓到了网页...
只是 parse 还要点力气...
--
To iterate is human, to recurse is divine.
递回只应天上有, 凡人该当用回圈. L. Peter Deutsch
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.114.78.40