选择仅在R中的单词witj拉丁字母

时间:2018-10-03 14:15:13

标签: r tm

说有数据

text=c(車、,男,犬, sba, druzhba)

我如何仅获取带有拉丁字母的单词的列表

这里

sba
druzhba

1 个答案:

答案 0 :(得分:2)

stringr包可用于此目的。有关如何使用unicode属性的详细信息,请参见?“ stringi-search-charclass”。

text=c("車","男","犬", "sba", "druzhba")

library(stringr)
text[str_detect(text, "[\\p{Letter}&&\\p{script=latin}]")]