在R中子集DataFrame

时间:2015-08-17 15:09:14

标签: r dataframe subset

我无法在R中对DataFrame进行子集化 数据框看起来像这样

  carat       cut color clarity depth table price    x    y    z
1  0.23     Ideal     E     SI2  61.5    55   326 3.95 3.98 2.43
2  0.21   Premium     E     SI1  59.8    61   326 3.89 3.84 2.31
3  0.23      Good     E     VS1  56.9    65   327 4.05 4.07 2.31
4  0.29   Premium     I     VS2  62.4    58   334 4.20 4.23 2.63
5  0.31      Good     J     SI2  63.3    58   335 4.34 4.35 2.75
6  0.24 Very Good     J    VVS2  62.8    57   336 3.94 3.96 2.48

我用于子集的代码看起来像这样

subset(diamonds, color = D)

无论出于何种原因,子集化数据帧都未正确过滤。当我看到它后面的字时,它包括的颜色超出了字母D.有人可以解释为什么会发生这种情况吗?以及我如何解决它?

请记住,我对R

非常陌生

2 个答案:

答案 0 :(得分:2)

subset(diamonds, color == 'D')

是您如何进行分组并在文档中得到很好的介绍。

答案 1 :(得分:0)

为了便于阅读,Sidhha指向的选项很好,有些人认为,包括subset帮助文件中的警告,最好使用标准的子集函数,如[。 Hadley Wickham讨论了herehere

因此,使用Heroka在评论中写的标准子集函数[有时更可取:

diamonds[diamonds$color == "D", ]