[問題] 抓取中文字串 locka PTT批踢踢實業坊

[問題] 抓取中文字串

作者: locka (locka) 2015-10-30 15:22:00

各位大大午安：
我今天有一組中文的資料，例如：
location <- as.factor(c("彰化縣溪州鄉高速公路", "澎湖縣馬公市關帝廟前"...))
想要請教該怎麼做我才可以只取出每個字串的"前三個字"呢?
我想到的方式是用grep,可惜遇到中文就失敗了...
以下是我失敗的指令:
city <- grep("\\D", location, value=TRUE, perl=TRUE)
有查到似乎regular expression比對中文可以用 [u4e00-\u9a05]
可是不是很清楚該如何使用...
可以提供一些意見嗎？或是其實根本是我用錯方法了？謝謝！
參考程式碼：
https://ideone.com/ccOlwz
[軟體熟悉度]:
請把以下不需要的部份刪除
入門(寫過其他程式，只是對語法不熟悉)
[環境敘述]:
R version 3.2.2 (2015-08-14)
Platform: i386-w64-mingw32/i386 (32-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1

作者: celestialgod (å¤©) 2015-10-30 15:24:00

substr(location , 1, 3)

作者: locka (locka) 2015-10-30 15:30:00

忘記最直覺的這招了!感謝c大!!!m(__)m

繼續閱讀

[問題] 指令 solve 原理?loser113 Re: [問題] 21點qhair [問題] ggplot 原點位置elone Re: [問題] dendextend package使用問題gbd37 [問題] 搜索並讀取 zip 中的檔案Edster Re: [問題] dendextend package使用問題celestialgod [問題] dendextend package使用問題gbd37 Re: [問題] 21點celestialgod [問題] 21點cano7127 Re: [問題] optim functioncelestialgod