作者elvisteal (TEAL)
看板Python
标题[问题] 网页模拟登入一问
时间Wed Apr 13 10:58:22 2011
请问若抓到的素质为
<form name="loginActionForm" method="post" action="/divanet/login/">
<p><input type="text" name="accessCode" maxlength="20" value=""class="ac_pass"></p>
<p><input type="password" name="password" maxlength="12" value=""class="ac_pass"></p>
<p align="center"><input type="submit" value=" " id="submit"></p>
</form>
网址是
http://XXXXXXXXXXXX/divanet/
那我的栏位变数要设成什麽?
accessCode => ?
password => ?
原本设这二个变数似乎是不行的 但又不知道要怎麽去参考那个 class="ac_pass"
------------------------------------------------
Python 新手上路 请多多包含
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 210.64.238.171
※ 编辑: elvisteal 来自: 210.64.238.171 (04/13 11:00)
1F:→ LewisHamiltn:看不懂 04/13 14:00
原程式
def post():
url_login = '
https://project-diva-ac.net/divanet/'
body = (
('accessCode',accesscode),
('password',password))
opener =
urllib2.build_opener(urllib2.HTTPCookieProcessor(cookielib.CookieJar()))
urllib2.install_opener(opener)
req = urllib2.Request(url_login,urllib.urlencode(body))
url = '
https://project-diva-ac.net/divanet/menu/'
req = urllib2.Request(url)
print urllib2.urlopen(req).read()
我大概参照了网路上的写法写自动登入後去抓登入完的
https://project-diva-ac.net/divanet/menu/
但一直无法登入後抓divanet/menu/ 一直都是在未登入状态抓取
所以我在想是不是我 body = (
('accessCode',accesscode),
('password',password)) 这有问题
但又不知道要怎麽改才对
※ 编辑: elvisteal 来自: 210.64.238.171 (04/13 14:51)