我有比特币历史数据。我将 "DATE" 列拆分为 "年月日和小时",因为我想根据小时对数据进行排序["AS 它是每小时基本数据"]。数据截止到 2021-12 年,即 12 月[“日期从每月 1 到 30”]。我想将此数据进一步排序为:- “2019-Jan,2020-Jan 20201-Jan”,然后是“2019-Feb,2020-Feb,2021-Feb”,不久之后
年 | 月 | 日 | 小时 | 打开 | 高 | 低 | 关闭 |
---|---|---|---|---|---|---|---|
2019 | 1 | 1 | 0 | 3700.05 | 3725.58 | 3698.83 | 3715.09 |
2019 | 2 | 1 | 0 | 3700.05 | 3725.58 | 3698.83 | 3715.09 |
2019 | 3 | 1 | 0 | 3700.05 | 3725.58 | 3698.83 | 3715.09 |
2019 | 4 | 1 | 0 | 3700.05 | 3725.58 | 3698.83 | 3715.09 |
2019 | 5 | 1 | 0 | 3700.05 | 3725.58 | 3698.83 | 3715.09 |
这可以通过说我已拆分“日期”列来完成吗?如果是,请就如何实现这一目标提出任何建议
原始“DATE”列如下:- 2019-01-01T00:00:00Z
答案 0 :(得分:0)
您可以先按 Month
排序,然后按 Year
排序:
>>> df.sort_values(["Month", "Year"], ignore_index=True)
Year Month DAy Hour open high low close
0 2019 1 1 0 3700.05 3725.58 3698.83 3715.09
1 2020 1 1 0 3700.05 3725.58 3698.83 3715.09
2 2019 2 1 0 3700.05 3725.58 3698.83 3715.09
3 2020 2 1 0 3700.05 3725.58 3698.83 3715.09
4 2019 3 1 0 3700.05 3725.58 3698.83 3715.09
(也将您的数据框更改为显示 2020 年)。