作者chan15 (ChaN)
看板Python
标题[问题] pyquery 解析 big5 网站发生问题
时间Tue Apr 30 08:24:22 2019
各位好今天写爬虫的时候遇到一个奇怪的问题
抓取与解析使用 python 2 的 urlib2 搭配 pyquery
一模一样的程式码在我的 ubuntu server 执行顺利
但 centos server 就会中断
为了抽丝剥茧直接把网页存成档案来 parser 的结果一样
程式码:
d = pq(response)
titles = d('td.list_proName')
for title in titles:
a = pq(title).find('a:first')
print(a.text())
-------------------------
ubuntu 16
python 2.17.2
pyquery 1.4.0
centos 7.6
python 2.17.5
pyquery 1.4.0
-------------------------
网址:
https://bre.is/fVLyR9i3J
执行上面的程式码 ubuntu 顺利跑出二十个名称,而 centos 的结果是
理肤宝水身体湿润霜 400ml 公司货中文标 PG美妆
理肤宝水多容安极效舒缓修护精华乳润泽型40ml 安肤霜 新效期 公司货中文标 PG美妆
理肤宝水多容安清洁卸
不知道问题出在那边
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.116.234.173
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1556583866.A.CB4.html