Re: [問題] unicode裡有str資料該怎麼轉？ blc PTT批踢踢實業坊

Re: [問題] unicode裡有str資料該怎麼轉？

作者: blc (Anemos) 2016-02-03 17:10:18

※ 引述《blc (Anemos)》之銘言：
: 請問一下，最近在試fbchat時，有個unicode變數一直print出亂碼，
: 用repr印出來長這樣：
: u'\xe7\x9c\x8b\xe6\x9c\x89\xe6\xb2\x92\xe6\x9c\x89\xe8\xa3\x9dlzma'
: 看起來像是把str的內容塞進unicode了(明明只有json.loads())，
: 請問該怎麼把它的內容轉成正常的unicode印出來呢？
我又來了……
這次的unicode變數長這樣：
u'\u0107\x98\u017b\u013a\x95\x8a'
內容是utf-8的'是啊'，但看起來就是某幾個unicode字元變成utf-8字串了。
直接給 .encode('iso-8859-1','ignore') 的話\u部份的就被省掉了……
如果是純字串的'是啊'會是下面的樣子：
'\xe6\x98\xaf\xe5\x95\x8a'
純unicode的話是：
u'\u662f\u554a'
請問這要怎麼解？

作者: blc (Anemos) 2016-02-03 17:13:00

json.loads()問題實在有點多……

作者: alibuda174 (阿哩不達) 2016-02-03 17:46:00

c = u'\u0107\x98\u017b\u013a\x95\x8a'print(c.encode('iso-8859-2').decode('utf-8'))

作者: blc (Anemos) 2016-02-03 20:17:00

哦哦感謝，我真該好好k手冊了有找到 chardet module，但是只能偵測str的樣子……然後偵測起來好像也不太準……

繼續閱讀

[問題] 從網頁抓取CSV資料後存檔問題threeSecGun [問題] 為什麼可以assign但不能print出來peace9527 [資訊] Django學習過程直播2stupidgod08 [問題] 推薦MAC OSX下GUI Lib/環境boGhosts [問題] unicode裡有str資料該怎麼轉？blc Re: [問題] 詢問list如行相加drjoey Re: [問題] 詢問list如行相加mantour Re: [問題] 詢問list如行相加ckc1ark [問題] 如何在atom裡增加python的library?x75395175951 [問題] Beautifulsoup的get_text()問題peace9527