如何基于列范围创建因子变量(即<15,15-30等)

时间:2019-03-29 19:06:02

标签: r

我正在基于RStudio中的“ nycflights13”数据来做学校作业,我需要创建一个因子变量(称为delaylevel),将dep_delay分为4类(<15分钟,15-30分钟,30-60分钟) ,小于60分钟)基于另一个我已经创建(如下所示)的过滤器变量Flight1,并将其称为新变量Flight2。

这样做之后,我需要使用group_by w / origin和delaylevel基于flt2查找延迟15分钟或更长时间的比例,其中我必须“消除丢失的延迟级别并汇总要计数的函数”。 (我相信我知道该怎么做,但是在第一部分遇到了麻烦)

任何帮助将不胜感激。

需要:tidyverse软件包和nycflights13软件包(航班)

1 个答案:

答案 0 :(得分:0)

您需要使用breaks参数的上限和下限,因为最小和最大中断之外的任何内容都会被强制为NA。如果您希望获得更好的因子水平,可以使用labels参数

cut(fit1, breaks=c(0,15,30,60,1000))