Re: [問題] jiebaR 針對文字檔讀取檔案處理

作者: andrew43 (討厭有好心推文後刪文者)   2016-09-12 00:13:43
我不知道那是 bug 還是如何。
就用我習慣的方式寫一個例子。
str0 <- scan("/somewhere/temp.txt", "character", fileEncoding = "big5")
str1 <- paste0(str0, collapse = "")
mixseg <= str
另外,按你給的資料,不覺得用 readr::read_table() 是好方法,
改用 scan() 吧。
※ 引述《wanson》之銘言:
: 請問一下
: 他的教學網站中提到"./temp.dat"
: 可以load 檔案進去
: 以下是他的說明
: 支持对文件进行分词:
: cc["./temp.dat"] ### 自动判断输入文件编码模式,默认文件输出在同目录下。
: ## segment( "./temp.dat" , mixseg )
: 英文說明
: You can pipe a file path to cut file.
: cutter <= "./temp.dat" ### Auto encoding detection.
: ## OR segment( "./temp.dat" , cutter )
: 很奇怪的是我自己怎樣嘗試都無法成功
: 這是我自己的目錄
: setwd("C:/SASMACRO/data/F2+Blank")
: mixseg <= "./temp.dat"
: 另外我如果使用read_table 去讀取txt檔案,如果檔案內只有簡單的幾個字
: 讀檔可以成功
: 但如果檔案有點大,而且一開始很多分行
: 就會失敗
: 例如下列的檔案 (temp.txt)
: https://www.dropbox.com/s/wdwgk8t64xgrlu9/temp.txt?dl=0
: 怎樣也都無法讀進去
: 想請教一下版上的高手
: 謝謝

Links booklink

Contact Us: admin [ a t ] ucptt.com