我想问一下如何使用熊猫调整(删除非重复的)两个不同公司的股票价格日期。
我已经通过[来自yahoo_finance import Share]下载了股票价格并将其保存为pickle。每个" len"数据集表示正如我预期的那样长度。
事情是,当我有一家日本公司和法国公司的历史股票价格数据时,他们必须有不同的假期,这样即使在相同的时间段内他们也会显示不同数量的数据集。如果我的公司数量很少,我曾经在excel手动完成,但随着我想要比较的公司数量的增加,我不能这样做。
如何仅删除"不共享相同日期的行"彼此?我已经有了' Date'作为其中一个专栏。
我相信必须有一些方法可以解决这个问题,因为这是处理金融时间序列数据的人每次都必须做的事情,我猜...
谢谢。
答案 0 :(得分:1)
确保已将date
解析为时间戳:
df1['date'] = pd.to_datetime(df1['date'])
df2['date'] = pd.to_datetime(df2['date'])
将date
列设置为索引:
df1 = df1.set_index('date')
df2 = df2.set_index('date')
找到索引的交集:
index = (df1.index).intersection(df2.index)
将DataFrame重新索引到公共日期:
df1 = df1.reindex(index)
df2 = df2.reindex(index)