作者goodtau (goodtau)
看板Python
标题Re: [范例] 无名小站相簿 grabber
时间Sun May 29 20:08:26 2011
打扰了
关於这个程式码
抓到最後一张会出错
会有403-error
抓不到最後一张照片的原因好像是因为
抓下来的原始码里头没有最後一张照片的位址?
请问有解决的办法吗
麻烦请大家回答了
谢谢
※ 引述《ellinas (keep your faith !)》之铭言:
: 我是初学者啦 小小修改一下
: 使用方法相同
: 修正:第一张相片捉不到 以及改用python的file物件 如此可在windows下使用
: import urllib2
: import re
: import sys
: import os
: global filename, addr
: addr = "http://www.wretch.cc/album"
: filename = 1
: def get_pic(path):
: global filename
: url = re.sub('&', r'&', addr+path)
: r = urllib2.Request(url)
: r.add_header('Referer', addr)
: r.add_header('User-Agent', 'Mozilla 5.0')
: cont = urllib2.urlopen(r)
: c = cont.readlines()
: for line in c:
: if re.match('.*<img id=\'DisplayImage\'.*?></a>', line):
: mat = re.findall('(http.*?)\'', line)
程式码有删掉一点
不好意思
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 118.170.8.135
1F:→ goodtau:还是不知道怎麽弄,有人可以再提点一下吗? 谢谢 05/30 19:39