[問題] 如何將未知編碼的字串轉換成utf-8?

作者: banana2014 (香蕉共和國)   2016-01-19 21:33:54
假測今天有一字串變數$str
且其編碼未知
今想讓該字串轉換編碼為utf-8
該怎麼做?
又若$str之編碼為big5
我如果寫成mb_convert_encoding($str, "utf-8", "auto");的話,它出來的編碼又會是亂

如果想直接偵測$str的編碼名稱為何,假設$str的編碼一樣是big5,寫成
mb_detect_encoding($str);的話它出來結果又是空值。
所以網路上有沒有一個一勞永逸的方法,就是不管$str是繁體字、簡體字、日文、韓文、
阿拉伯文或其他哩哩摳摳的文字編碼,都可以成功轉換成utf-8而且不會漏字。
謝謝
作者: LPH66 (-6.2598534e+18f)   2016-01-19 22:39:00
文字編碼是個「你沒說我只能用水晶球猜猜看」的玩意猜編碼是有一些統計上的方法, 但不可能 100% 完美
作者: locklose (允)   2016-01-20 00:28:00
樓上說的真的太好了,真的是用猜的。

Links booklink

Contact Us: admin [ a t ] ucptt.com