删除R中所有非拉丁字符

时间:2018-10-06 12:27:12

标签: r string tm

这里有两个字符串

*3472459 PIVO 何か-何か-何か/100х1,5g

*3472459 VINO 何か何か何か100х1,5g

如何删除所有非拉丁字符?  输出应该是

PIVO
Vino

1 个答案:

答案 0 :(得分:3)

给定文本中的文本字符串,来自stringr的str_extract或来自stringi的stri_extract返回预期结果。

text <- c("*3472459 PIVO 何か-何か-何か/100х1,5g",
          "*3472459 VINO 何か何か何か100х1,5g")

stringr::str_extract(text, "[:alpha:]+")
[1] "PIVO" "VINO"

stringi::stri_extract(text, regex = "[:alpha:]+")
[1] "PIVO" "VINO"