{origin:
2018-06-01T09:30:00.000+00:00 BID 30415.000 4
2018-06-01T09:30:00.000+00:00 BID 30415.000 3
2018-06-01T09:30:01.000+00:00 BID 30415.000 2
2018-06-01T09:30:01.000+00:00 BID 30414.000 4
2018-06-01T09:30:01.000+00:00 ASK 30416.000 1
2018-06-01T09:30:01.000+00:00 ASK 30416.000 2
2018-06-01T09:30:01.000+00:00 TRADE 30415.000 1
}
我想重新格式化数据,如下所示:
时间戳出价bid_size询问ask_size交易 trade_size
{2018-06-01T09:30:00.000+00:00 30415 4 nan nan nan nan
2018-06-01T09:30:00.000+00:00 30415 3 nan nan nan nan
2018-06-01T09:30:01.000+00:00 30415 2 30416 1 nan nan
2018-06-01T09:30:01.000+00:00 30415 4 30416 2 30415 1
}
能否请您帮助使用Python?我也遇到了一个重复的时间戳问题,我认为这是因为它的刻度数据导致相同的时间戳与不同的出价大小/要价大小,并且我也不知道如何正确地将它们放在同一行中。
答案 0 :(得分:0)
根据您的示例尚不完全清楚,但是首先要做的是将数据加载到一个名为例如的pandas DataFrame中。 df
,而不是现在的字典。确保此DataFrame具有清晰的标题名称。
如果数据在熊猫DataFrame中,则可以使用DataFrame.pivot()
,有关详细说明,请参见this link。
在您的情况下,您最终会得到类似的东西:
df.pivot(index=<Column1>, columns=<Column2>, values=<Column3>)
您需要用提供的相应标头替换<ColumnX>
。
希望这会有所帮助!