作者tides (monet)
看板Python
标题[问题] requests.get中文网址出现 BadStatusLine
时间Sun Jan 27 21:03:36 2019
新人刚接触 Crawler
想要爬中文网址的 url
(e.g.
https://dictionary.cambridge.org/zht/词典/英语-汉语-繁体/tuple)
使用下面的方式处理 UTF-5
但会碰到 http.client.BadStatusLine 的问题
不知道有什麽可能的解决方向?
底下是示范码:
import requests
# import sys
from safeprint import print
import urllib
url1 = "
https://dictionary.cambridge.org/zht/词典/英语-汉语-繁体/tuple"
url5 = "
https://dictionary.cambridge.org/zht/%E8%A9%9E%E5%85%B8/%E8%8B%B1%E8%AA%9E-%E6%BC%A2%E8%AA%9E-%E7%B9%81%E9%AB%94/tuple"
url6a = "
https://dictionary.cambridge.org/zht/"
url6b = urllib.parse.quote("词典/英语-汉语-繁体")
url6c = "/tuple"
url6 = url6a + url6b + url6c # url6 = url5
print(url6)
print(url5)
r = requests.get(url5) # get error here
r.encoding='utf-8'
print(r.text)
--
Sent from my Windows
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.34.37.144
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1548594218.A.D82.html
1F:→ nini200: 这网站你要的是什麽?? 01/31 05:51