[問題] 中文編碼錯誤

作者: aiweisen (艾維森)   2015-05-13 00:20:05
我目前遇到的情況是這樣子
我很早之前有寫個程式 是先將中文透過urllib.quote把它編碼成utf8後
再利用urllib.urlencode 把它編碼成url的形式送出去
另一邊收到後會使用urllib.unquote把這個url進行解碼
但是我不知道改到哪一邊 我編碼後輸出很奇怪
以這篇 #1ANKD1la (Python) 為例
照理說執行urllib.quote 後 輸出應該是 %E5%A4%A7%E5%AD%B8%E7%94%9F
但我的卻是這樣
>>print urllib.quote(u'大學生'.encode('utf8'))
%C2%A4j%C2%BE%C3%87%C2%A5%C3%8D
>>print urllib.unquote(u'大學生'.decode('utf8'))
¤j¾Ç¥Í
請問我這是錯在哪阿?
作者: uranusjr (←這人是超級笨蛋)   2015-05-13 01:29:00
這結果有點像 big5 ('%A4j%BE%C7%A5%CD') 然後位元移位我猜是你 console encoding 有問題, 但有點懶得追先猜存成檔案執行就會好了
作者: AndCycle (AndCycle)   2015-05-13 01:44:00

Links booklink

Contact Us: admin [ a t ] ucptt.com