我正在尝试使用group_by()
和summarise()
将交易数据从1分钟的粒度汇总到5分钟。我想group_by应该只影响指定为参数(DateTime
)的列,但似乎也会影响其他列(取整值)。
这是我在调用group_by()之前拥有的数据:
head(dfFeatureData1)
DateTime Open High Low Close Volumn Position
195205 2016-01-04 09:31:00 3640.0 3640.0 3628.2 3633.2 416 28822
195206 2016-01-04 09:32:00 3633.6 3642.6 3633.6 3642.6 161 28701
195207 2016-01-04 09:33:00 3642.6 3644.8 3640.8 3644.8 94 28642
195208 2016-01-04 09:34:00 3646.6 3650.6 3646.6 3648.4 114 28565
195209 2016-01-04 09:35:00 3648.4 3653.4 3647.0 3650.0 81 28523
195210 2016-01-04 09:36:00 3650.0 3657.4 3650.0 3651.0 93 28475
然后致电group_by()
dfFeatureData2 <- group_by(dfFeatureData1, DateTime = cut(DateTime, breaks="5 min"))
然后得到以下结果:
head(dfFeatureData2)
# A tibble: 6 x 7
# Groups: DateTime [2]
DateTime Open High Low Close Volumn Position
<fct> <dbl> <dbl> <dbl> <dbl> <int> <int>
1 2016-01-04 09:31:00 3640. 3640. 3628. 3633. 416 28822
2 2016-01-04 09:31:00 3634. 3643. 3634. 3643. 161 28701
3 2016-01-04 09:31:00 3643. 3645. 3641. 3645. 94 28642
4 2016-01-04 09:31:00 3647. 3651. 3647. 3648. 114 28565
5 2016-01-04 09:31:00 3648. 3653. 3647. 3650. 81 28523
6 2016-01-04 09:36:00 3650. 3657. 3650. 3651. 93 28475
您会看到“打开/最高/最低/关闭”列中的数据受到影响(回合),这不是预期的结果。