仅从字符串向量中提取包含ASCII字符的单词

时间:2016-12-22 06:08:06

标签: r stringr qdap

我坚持下去,所以,欢迎任何建议。

b <- str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))

返回一个列表:

    List of 2
 $ : chr [1:2] "hello" "ring"
 $ : chr "trust"

但我希望为向量c('hello ringпрг','trust')的每个元素(例如"hello ring", "trust")提供包含此单词字符串的向量。任何其他功能和包也是受欢迎的。

2 个答案:

答案 0 :(得分:2)

我们可以使用

unlist(str_extract_all(c('hello ringпрг','trust'), regex("[A-Za-z ]+", TRUE)))
#[1] "hello ring" "trust" 

或将模式用作"[[:ascii:]]+"

答案 1 :(得分:2)

sapplypaste一起使用,如下所示:

b<-str_extract_all(c('hello ringпрг','trust'), regex("[a-z]+", TRUE))

sapply(b, paste, collapse = " ")

## [1] "hello ring" "trust"