作者locka (locka)
看板R_Language
标题[问题] 抓取中文字串
时间Fri Oct 30 15:22:00 2015
各位大大午安:
我今天有一组中文的资料,例如:
location <- as.factor(c("彰化县溪州乡高速公路", "澎湖县马公市关帝庙前"...))
想要请教该怎麽做我才可以只取出每个字串的"前三个字"呢?
我想到的方式是用grep,可惜遇到中文就失败了...
以下是我失败的指令:
city <- grep("\\D", location, value=TRUE, perl=TRUE)
有查到似乎regular expression比对中文可以用 [u4e00-\u9a05]
可是不是很清楚该如何使用...
可以提供一些意见吗?或是其实根本是我用错方法了?谢谢!
参考程式码:
https://ideone.com/ccOlwz
[软体熟悉度]:
请把以下不需要的部份删除
入门(写过其他程式,只是对语法不熟悉)
[环境叙述]:
R version 3.2.2 (2015-08-14)
Platform: i386-w64-mingw32/i386 (32-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.110.191
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1446189724.A.805.html
1F:→ celestialgod: substr(location , 1, 3) 10/30 15:24
2F:→ locka: 忘记最直觉的这招了!感谢c大!!!m(__)m 10/30 15:30