我正在研究Grolemund的“ R for Data Science”,一个问题要求我评估一些数据。这些数据来自nycflights13
数据集。我只是想了解{ {1}}发挥了我的作用。
mean()
我想了解的是平均值是多少?我相信程序输出的结果是整个数据集中符合条件delay_char = flights %>%
group_by() %>%
summarize(n = n(),
fifteen_early = mean(arr_delay == - 15, na.rm = T)
的航班所占的比例。但这不是什么意思。我是否需要在arr_delay == -15
之上使用其他条件来获取与该特定子集相关的均值?
我想我可能已经部分回答了自己的问题,但是我仍然对R在我的代码串中所做的事情感到好奇。