计算符合逻辑标准的观测数量的最有效方法是什么?

时间:2015-08-12 05:54:53

标签: r

使用ggplot2::diamonds数据集,我试图计算成本低于一定金额的钻石数量。我能弄清楚的唯一方法是创建一个新变量并对数据进行子集化,然后计算新向量中的剩余观察值。

示例:

newVector <- subset(diamonds, price<600)
nrow(newVector)

我想知道解决这个问题的最佳方法是什么?因为我的方法感觉笨重。

2 个答案:

答案 0 :(得分:6)

使用sum

data(diamonds)  # library(ggplot2)
sum(diamonds$price < 600)

答案 1 :(得分:1)

使用table的另一种选择:

table(diamonds$price < 600)

输出:

FALSE  TRUE 
49831  4109

使用dplyr

library(dplyr)    
diamonds %>%
      summarise(sum(price < 600))

使用sqldf

library(sqldf)
sqldf("SELECT COUNT(price) 
      FROM diamonds
      WHERE price < 600")