我有多个数据集代表多个经济指标。 每个数据集都有5列,每个数据集的列名相同。 列名称为[日期时间,实际,共识,上一个,已修订]。 问题是我想将这些数据集合并为一个数据集,以便为将来的工作做好准备。 我试过这个:
import pandas as pd
df1 = pd.read_csv(r'E:\Tutorial\Sentix Investor Confidence - European Monetary Union.csv')
df2 = pd.read_csv(r'E:\Tutorial\Services Sentiment - European Monetary Union.csv')
df3 = pd.read_csv(r'E:\Tutorial\ZEW Survey - Economic Sentiment - European Monetary Union.csv')
frames = [df1, df2, df3]
result = pd.concat(frames,join='inner')
print(result)
但结果是这样的 data result 这对我来说是绝对错误的,因为尽管名称相似,但它们的指标却截然不同,所以我不能将它们混合在一起。 我需要的是一些事情like this, 或其他一些事情做类似的工作,以保持每个指标的身份。
答案 0 :(得分:1)
仍在使用pd.concat
pd.concat([df,df,df],keys=['yourkey1','yourkey2','yourkey3'],axis=1)
Out[234]:
yourkey1 yourkey2 yourkey3
C1 C2 C1 C2 C1 C2
0 1 10 1 10 1 10
1 2 20 2 20 2 20
2 3 3 3 3 3 3
3 4 40 4 40 4 40
数据输入
df = pd.DataFrame({'C1': [1,2,3,'4'], 'C2': [10, 20, '3',40]})
将'yourkey_'更改为您需要的