在R中搜索单词

时间:2018-02-27 16:14:10

标签: r

在R中,我在列中有描述,我正在搜索描述中的特定单词。例如:

id description
1 "this is a house"
2 "the house is white"
3 "the apartment is far"
4 "the house is close"

我想知道哪些描述包含单词" house",我想知道哪些id属于他们。我尝试使用grepl但是我没有成功。

任何人都可以帮助我吗?谢谢!

2 个答案:

答案 0 :(得分:0)

您可以使用可以使用正则表达式匹配的函数,例如grepl

df <- data.frame(id = 1:7,  description = c("this is a house", "the house is white", 
"the apartment is far", "the house is close", "House in the woods", "HOUSE", "Penthouse"))
df$id[grepl('(^| )house( |$|\\.)', tolower(df$description))]                 

#[1] 1 2 4 5 6

根据您要匹配的内容调整正则表达式。这里(^ |)匹配行或空格的开头和(| $ | \\。)空格,行尾或逗号。

答案 1 :(得分:-1)

 grep("house",dat$description)
[1] 1 2 4