[問題] 讀取csv檔的小問題

作者: ToastCheng (ToastCheng哥)   2015-01-16 14:42:29
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
新手(沒寫過程式,R 是我的第一次)
[問題敘述]:
我主要是想問read.csv(或read.table)在什麼情況下會出問題,
在參數的設定上是不是只要sep有先注意是""還是","、quote有
時要設成""之外,其他都只是讀取檔案的偏好而不影響能不能讀取成功~?
會有這個問題是因為在網路上看到交大的課程,好奇點了作業2
http://ghuang.stat.nctu.edu.tw/course/bigdata14/homework.asp
有一個csv檔,我成功地用download.file(url,destfile,method="curl")
下載下來(在電腦也能直接開啟)
但是用read.table或read.csv卻一直出錯,
但開啟其他csv檔卻沒問題(參數都用一樣的)
[程式範例]:
> read.csv("/Users/Toast/Desktop/coursera R/FiveCities2.csv")
結果:
錯誤在make.names(col.names, unique = TRUE) :
無效的多位元組字串於 '<b6>m<c2><ed><a5><ab><b0><cf>'
作者: ty854697   2015-01-16 15:05:00
我試的結果是因為encoding是big5才會有這樣的錯誤,可以參考http://joe11051105.gitbooks.io/r_basic/content/data_import_and_export/import_data.html
作者: obarisk (OSWALT)   2015-01-16 15:13:00
"string,"string2",這種就會出問題
作者: ToastCheng (ToastCheng哥)   2015-01-17 03:11:00
感謝ty大,我成功用readline+for loop將它換成utf8重開了,不過好複雜阿@@,以後遇到big5編碼只能這樣解決嗎
作者: Wush978 (拒看低質媒體)   2015-01-17 03:58:00
可以先用命令列工具把檔案轉成utf8
作者: obarisk (OSWALT)   2015-01-17 07:37:00
read.csv(fileEncoding='big5'),不過有可能會掉字
作者: ToastCheng (ToastCheng哥)   2015-01-17 15:17:00
感謝~晚點來試試原來是fileEncoding...一開始一直改encoding="big5"
作者: obarisk (OSWALT)   2015-01-18 07:15:00
在read.xxx的函式裡,encoding是輸出的編碼
作者: autum134679 (Chiu Wen)   2015-01-19 02:14:00
感謝大家,我完成了~~~

Links booklink

Contact Us: admin [ a t ] ucptt.com