使用ggplot2::diamonds
数据集,我试图计算成本低于一定金额的钻石数量。我能弄清楚的唯一方法是创建一个新变量并对数据进行子集化,然后计算新向量中的剩余观察值。
示例:
newVector <- subset(diamonds, price<600)
nrow(newVector)
我想知道解决这个问题的最佳方法是什么?因为我的方法感觉笨重。
答案 0 :(得分:6)
使用sum
data(diamonds) # library(ggplot2)
sum(diamonds$price < 600)
答案 1 :(得分:1)
使用table
的另一种选择:
table(diamonds$price < 600)
输出:
FALSE TRUE
49831 4109
使用dplyr
:
library(dplyr)
diamonds %>%
summarise(sum(price < 600))
使用sqldf
:
library(sqldf)
sqldf("SELECT COUNT(price)
FROM diamonds
WHERE price < 600")