为什么group_by将舍入其他列中的数据?

时间:2019-05-03 00:59:14

标签: r group-by

我正在尝试使用group_by()summarise()将交易数据从1分钟的粒度汇总到5分钟。我想group_by应该只影响指定为参数(DateTime)的列,但似乎也会影响其他列(取整值)。

这是我在调用group_by()之前拥有的数据:

head(dfFeatureData1)

                  DateTime   Open   High    Low  Close Volumn Position
195205 2016-01-04 09:31:00 3640.0 3640.0 3628.2 3633.2    416    28822
195206 2016-01-04 09:32:00 3633.6 3642.6 3633.6 3642.6    161    28701
195207 2016-01-04 09:33:00 3642.6 3644.8 3640.8 3644.8     94    28642
195208 2016-01-04 09:34:00 3646.6 3650.6 3646.6 3648.4    114    28565
195209 2016-01-04 09:35:00 3648.4 3653.4 3647.0 3650.0     81    28523
195210 2016-01-04 09:36:00 3650.0 3657.4 3650.0 3651.0     93    28475

然后致电group_by()

dfFeatureData2 <- group_by(dfFeatureData1, DateTime = cut(DateTime, breaks="5 min"))

然后得到以下结果:

head(dfFeatureData2)

# A tibble: 6 x 7
# Groups:   DateTime [2]
  DateTime             Open  High   Low Close Volumn Position
  <fct>               <dbl> <dbl> <dbl> <dbl>  <int>    <int>
1 2016-01-04 09:31:00 3640. 3640. 3628. 3633.    416    28822
2 2016-01-04 09:31:00 3634. 3643. 3634. 3643.    161    28701
3 2016-01-04 09:31:00 3643. 3645. 3641. 3645.     94    28642
4 2016-01-04 09:31:00 3647. 3651. 3647. 3648.    114    28565
5 2016-01-04 09:31:00 3648. 3653. 3647. 3650.     81    28523
6 2016-01-04 09:36:00 3650. 3657. 3650. 3651.     93    28475

您会看到“打开/最高/最低/关闭”列中的数据受到影响(回合),这不是预期的结果。

0 个答案:

没有答案