合并具有相似列名的多个数据集

时间:2017-11-24 21:19:11

标签: pandas dataset

我有多个数据集代表多个经济指标。 每个数据集都有5列,每个数据集的列名相同。 列名称为[日期时间,实际,共识,上一个,已修订]。 问题是我想将这些数据集合并为一个数据集,以便为将来的工作做好准备。 我试过这个:

import pandas as pd

df1 = pd.read_csv(r'E:\Tutorial\Sentix Investor Confidence - European Monetary Union.csv')
df2 = pd.read_csv(r'E:\Tutorial\Services Sentiment - European Monetary Union.csv')
df3 = pd.read_csv(r'E:\Tutorial\ZEW Survey - Economic Sentiment - European Monetary Union.csv')
frames = [df1, df2, df3]
result = pd.concat(frames,join='inner')
print(result)

但结果是这样的 data result 这对我来说是绝对错误的,因为尽管名称相似,但它们的指标却截然不同,所以我不能将它们混合在一起。 我需要的是一些事情like this, 或其他一些事情做类似的工作,以保持每个指标的身份。

1 个答案:

答案 0 :(得分:1)

仍在使用pd.concat

pd.concat([df,df,df],keys=['yourkey1','yourkey2','yourkey3'],axis=1)
Out[234]: 
  yourkey1     yourkey2     yourkey3    
        C1  C2       C1  C2       C1  C2
0        1  10        1  10        1  10
1        2  20        2  20        2  20
2        3   3        3   3        3   3
3        4  40        4  40        4  40

数据输入

df = pd.DataFrame({'C1': [1,2,3,'4'], 'C2': [10, 20, '3',40]})

将'yourkey_'更改为您需要的