有没有办法用r中的部分数据值过滤数据集?

时间:2014-05-20 23:00:57

标签: r

R.的帮助 我有一个数据集,其中一些列具有字符串的值,如“沥青煤”,“xxx油”,“yyy oil”,“zzz煤,.... 我想要的是找到一种方法来仅对该列中包含文本“coal”的数据进行子集化。请帮忙!!!

2 个答案:

答案 0 :(得分:0)

看看“子集”。 您应该可以执行以下操作:

mySub = subset(data, columnName=="coal")

如果您正在寻找更多文本灵活性,可以使用grepl:

mySub  = subset(data, grepl("oil", data$columnName))

这对你有用吗?

答案 1 :(得分:0)

你应该看看grep。类型:

?grep

一个例子:

a <- c("a coal", "a coal", "c oil")
# use grep function
a[grep("coal", a)] 

确实,您应该了解正则表达式(正则表达式)。你不会后悔花在它上面的时间。他们无处不在。 (最近我发现你甚至可以在ms excel中使用它们)