Re: [問題] utf8 encoding to decoding

作者: uranusjr (←這人是超級笨蛋)   2016-07-19 01:59:25
※ 引述《kyuudonut (CC)》之銘言:
: 各位先進好
: 小弟最近在抓網站資料 (用3.5)
: 結果抓下來的中文先被encoding,儲存成編碼的形式了@@ (EX. \uXXXX)
: 查了好久 2.7 好像可以使用decode
: 但到 3.5 因為統一使用unicode 所以用str就夠了
: 但小弟試好久都沒有辦法轉成中文 @@
: 因為對於電腦來說 每個都還是一個文字吧!?
: 查到的例子中 往往都是
: string = u'\uXXXX'
: print(string)
: 便可以直接轉成對應字元
: 但小弟現在每一個字都是分開的阿阿阿
: 合在一起是一個字串阿!!!(淚) {'\', 'u', 'X', 'X', 'X', 'X'}
: 不知道有沒有先進有過類似開發經驗
: 能夠給個提示或關鍵字
: 謝謝 QAQ
data = ['\\', 'u', '5', '9', '2', '7']
s = ''.join(data)
b = s.encode('ascii')
u = b.decode('unicode_escape')
print(u) # 校
作者: s860134 (s860134)   2016-07-19 02:12:00
明明就是 '大' XD 還有一個解 chr(int('5927',16))
作者: uranusjr (←這人是超級笨蛋)   2016-07-19 02:13:00
我改了碼忘了改字 XD如果是一個字的話上面的方法比較好, 但這種的通常都是一串文字包含跳脫序列, 這時候 unicode_escape 就很方便
作者: s860134 (s860134)   2016-07-19 02:15:00
你說的有理
作者: kyuudonut (善良老百姓)   2016-07-19 09:57:00
轉出來了!!! 謝謝兩位!!! http://imgur.com/llavlCDTAT

Links booklink

Contact Us: admin [ a t ] ucptt.com