[問題] lxml.html 中文 URL 的亂碼問題

作者: ggirls (哥)   2016-10-07 21:48:31
import lxml.html
e = lxml.html.fromstring('<a name="中文">什麼</a>')
print(lxml.html.tostring(e, encoding='unicode'))
結果
<a name="%E4%B8%AD%E6%96%87">什麼</a>
URL 的部分都被轉碼了。雖然這應該是符合規格。
可辦法叫他不要轉嗎?
作者: longlongint (華哥爾)   2016-10-08 01:00:00
如果你不會用到HTTP 就不用轉
作者: s860134 (s860134)   2016-10-08 01:00:00
urllib.parse.unquote(result) 好險你用 python3如果你用 python2 你會有點惱地抄一段 \Lib\urlparse.py

Links booklink

Contact Us: admin [ a t ] ucptt.com