我正在基于RStudio中的“ nycflights13”数据来做学校作业,我需要创建一个因子变量(称为delaylevel),将dep_delay分为4类(<15分钟,15-30分钟,30-60分钟) ,小于60分钟)基于另一个我已经创建(如下所示)的过滤器变量Flight1,并将其称为新变量Flight2。
这样做之后,我需要使用group_by w / origin和delaylevel基于flt2查找延迟15分钟或更长时间的比例,其中我必须“消除丢失的延迟级别并汇总要计数的函数”。 (我相信我知道该怎么做,但是在第一部分遇到了麻烦)
任何帮助将不胜感激。
需要:tidyverse软件包和nycflights13软件包(航班)
答案 0 :(得分:0)
您需要使用breaks参数的上限和下限,因为最小和最大中断之外的任何内容都会被强制为NA。如果您希望获得更好的因子水平,可以使用labels
参数
cut(fit1, breaks=c(0,15,30,60,1000))