[問題] requests.get中文網址出現 BadStatusLine

作者: tides (monet)   2019-01-27 21:03:36
新人剛接觸 Crawler
想要爬中文網址的 url
(e.g. https://dictionary.cambridge.org/zht/詞典/英語-漢語-繁體/tuple)
使用下面的方式處理 UTF-5
但會碰到 http.client.BadStatusLine 的問題
不知道有什麼可能的解決方向?
底下是示範碼:
import requests
# import sys
from safeprint import print
import urllib
url1 = "https://dictionary.cambridge.org/zht/詞典/英語-漢語-繁體/tuple"
url5 = "https://dictionary.cambridge.org/zht/%E8%A9%9E%E5%85%B8/%E8%8B%B1%E8%AA%9E-%E6%BC%A2%E8%AA%9E-%E7%B9%81%E9%AB%94/tuple"
url6a = "https://dictionary.cambridge.org/zht/"
url6b = urllib.parse.quote("詞典/英語-漢語-繁體")
url6c = "/tuple"
url6 = url6a + url6b + url6c # url6 = url5
print(url6)
print(url5)
r = requests.get(url5) # get error here
r.encoding='utf-8'
print(r.text)
作者: nini200 (200妮妮)   2019-01-31 05:51:00
這網站你要的是什麼??

Links booklink

Contact Us: admin [ a t ] ucptt.com