Re: [問題] Unicode Decode Error

作者: suhang (suhang)   2014-10-30 15:00:36
※ 引述《suhang (suhang)》之銘言:
: 標題: [問題] Unicode Decode Error
: 時間: Wed Oct 29 13:28:18 2014
:
: 我寫了一個crawler爬網頁
: 按照view page source <meta content="text/html; charset=Big5">
: 我用Big5 解碼回傳的 byte string
: Python卻回應某些byte無法解碼
: UnicodeDecodeError: illegal multibyte sequence
:
: 1
: 瀏覽器也是設定Big5解碼
: 那為什麼瀏覽器可以正確的顯現所有內容?
:
: 2
: 我試著用utf8瞎猜去解碼,一樣有error
: 請問我該如何處理這個錯誤而能顯示我所抓下來的網頁?
:
:
作者: mmis1000 (秋月戀楓)   2014-10-30 15:38:00
http://goo.gl/JP8a7J 請愛用 google 跟 stackoverflowbtw 大部分軟體跟瀏覽器的標準行為,是把不認識的字替換成 http://goo.gl/Vy1nZI (ptt打不出來)
作者: LPH66 (-6.2598534e+18f)   2014-10-30 16:00:00
還有一個可能是其實瀏覽器是認得某些內容的也就是瀏覽器使用的解碼表跟你用的解碼表不一樣(這也是原 PO 的問題) 這種解法一般是自己去找份解碼表來用例如 PCMan 就是自己準備解碼表的

Links booklink

Contact Us: admin [ a t ] ucptt.com