Re: [問題] 跑文字mining的錯誤訊息

作者: psinqoo (零度空間)   2015-06-25 00:09:16
library(tm)
library(tmcn)
library(Rwordseg)
x1 <-read.csv(file.choose(),header=T)#讀入資料
x2 <-Corpus(VectorSource(x1))#向量格式
x3 <- tm_map(x2, removePunctuation)#去除標點符號
x4 <- tm_map(x3, removeNumbers)#去除數字
x5 <- tm_map(x4, function(word) {
gsub("[A-Za-z0-9]", "", word)
})#清除大小寫英文與數字
#inspect(d.corpus )#看内容
x6 <- tm_map(x5,segmentCN, nature = TRUE)#斷詞
x7 <- Corpus(VectorSource(x6))
相同問題 執行到 x7
一樣出現
Error in UseMethod("meta", x) :
no applicable method for 'meta' applied to an object of class "character"
應該是升級 tm 包 後產生??
x7有誰知道這段如何改
※ 引述《nh2 (nh)》之銘言:
: [問題類型]:
:
: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
:
: [軟體熟悉度]:
: 請把以下不需要的部份刪除
: 入門(寫過其他程式,只是對語法不熟悉)
: [問題敘述]:
: 請簡略描述你所要做的事情,或是這個程式的目的
: [環境敘述]:
:
: mac Rstudio, R3.2
:
: corp = Corpus(DirSource("./text/combine/"))
: head(corp)
: corp = tm_map(corp, stripWhitespace)
: corp = tm_map(corp, removePunctuation)
: corp = tm_map(corp, removeNumbers)
: corp = tm_map(corp, function(word){
: gsub("[A-Za-z0-9]","",word)})
: corp = tm_map(corp, PlainTextDocument)
: corp = tm_map(corp, removeWords,stopwords("english"))
: # 中文 stop words
: stopss = stopwordsCN()
: corp = tm_map(corp,removeWords, stopss)
: # 中文斷詞
: corp2 = tm_map(corp, content_transformer(segmentCN))
: corp2 = tm_map(corp, content_transformer(segmentCN), returnType = 'tm')
: corp2 <- tm_map(corp, content_transformer(segmentCN), nature = TRUE)
: corp2 <- tm_map(corp, function(sentence) {
: noun <- lapply(sentence, function(w) {
: w[names(w) == "n"]
: })
: unlist(noun)
: })
: corp3 = Corpus(VectorSource(corp2))
: 跑到最後一行就出現錯誤訊息寫:
: Error in UseMethod("meta", x) :
: 沒有適用的方法可將 'meta' 套用到 "character" 類別的物件
: 本來有想過是資料夾裡文件編碼的問題
: 但是文件有中有英文,中文小弟用程式轉成UTF8 ~~
: 另一個問題是不知道各位面對很多big5碼,有什麼方式比較快轉成utf8的?
作者: obarisk (OSWALT)   2015-06-25 17:55:00
segmentCN得到的結果不是vector
作者: psinqoo (零度空間)   2015-06-25 18:00:00
那該如何轉?
作者: penolove (醜獸的女朋友)   2015-06-27 01:13:00
x7[i]=paste(unlist(x7[i]),collapse =", ")*x6才對 自己是這樣做
作者: obarisk (OSWALT)   2015-06-27 06:27:00
把上面寫成function,餵給tm_map

Links booklink

Contact Us: admin [ a t ] ucptt.com