[心得] 中文編碼處理

作者: Wush978 (拒看低質媒體)   2015-11-14 01:20:57
[關鍵字]: R, Encoding
[重點摘要]:
上個月我在台大授課時撰寫了一份swirl 教材:
https://github.com/wush978/DataScienceAndR
其中 RBasic-07-Loading-Dataset 寫了目前我知道的數個R 處理Encoding的方法。
由於坊間比較少解決載入中文資料的R 教材,
而且我今天晚上才剛更新這門課程的內容,需要有網友幫忙測測看相容性。
所以希望有任何想了解如何解決中文資料編碼問題的網友,可以一邊學,一邊幫我測。
以下列出教材中有提到的部分:
1. file + 參數 encoding
- 在windows上遇到如UTF-16仍然會出錯
2. readBin + stringi::stri_encode + textConnection + 參數 encoding
- 目前可以解決我手上所有中文的狀況,但是效能稍差
有興趣幫忙測試的網友,
請依照README的只是安裝課程之後,直接進入RBasic-07-Loading-Dataset進行課程。
有任何問題或feedback(安裝看不懂、解釋看不懂、電腦爆炸...)
歡迎截圖貼到 https://github.com/wush978/DataScienceAndR/issues 開issue給我
先謝謝各位
作者: cywhale (cywhale)   2015-11-14 18:20:00
stringi+encoding help in many cases~ Thanks sharing~

Links booklink

Contact Us: admin [ a t ] ucptt.com