操纵数据框以创建多个时间序列列

时间:2019-07-23 23:01:36

标签: python pandas dataframe

我有一个数据框,看起来像链接中的图片一样(显示了前5个和最后5个观察结果)。

current dataframe structure

我想通过删除符号列,而将符号/结算值作为多个列来操纵此数据框。因此,输出应类似于下面链接中的图片(数据框将具有70+个符号列,但仅显示两个符号作为示例),如果在某个日期没有相应的符号结算价,则产生NaN。使用的日期是符号ES的日期(以下未显示)。

desired dataframe structure

#Import libraries and read the CSV file
import numpy as np
import pandas as pd

df=pd.read_csv('Futures Correlation Matrix.csv', index_col='DATE', usecols=['DATE', 'SYMBOL', 'SETTLE'])

#Convert index series to datetime
df.index=pd.to_datetime(df.index)

#Sort the dataframe by index and symbol
df=df.sort_values(by = ['SYMBOL', 'DATE'], ascending = [True, True])

PS:这是我关于stackoverflow的第一篇文章,因此如果问题不清楚,我会向您道歉。

0 个答案:

没有答案