在R中,我在列中有描述,我正在搜索描述中的特定单词。例如:
id description
1 "this is a house"
2 "the house is white"
3 "the apartment is far"
4 "the house is close"
我想知道哪些描述包含单词" house",我想知道哪些id属于他们。我尝试使用grepl但是我没有成功。
任何人都可以帮助我吗?谢谢!
答案 0 :(得分:0)
您可以使用可以使用正则表达式匹配的函数,例如grepl
:
df <- data.frame(id = 1:7, description = c("this is a house", "the house is white",
"the apartment is far", "the house is close", "House in the woods", "HOUSE", "Penthouse"))
df$id[grepl('(^| )house( |$|\\.)', tolower(df$description))]
#[1] 1 2 4 5 6
根据您要匹配的内容调整正则表达式。这里(^ |)匹配行或空格的开头和(| $ | \\。)空格,行尾或逗号。
答案 1 :(得分:-1)
grep("house",dat$description)
[1] 1 2 4