将pandas DataFrame与Series合并

时间:2017-10-02 22:11:54

标签: python pandas dataframe merge series

我有这个df:

             cnpj
0  33062217000185
1  82645144000160

我运行一个创建两个不同系列的函数:

for i in df.cnpj:
    s=peer_comparison(i)
    df=df.merge(peers.to_frame().T, how='left', on='cnpj')

在第一轮的句子中,输出系列如下:

s (first round):

A                                  N/A
B                                  N/A
C                                  N/A
cnpj                    33062217000185

合并后的数据框如下所示:

             cnpj   A       B     C
0  33062217000185   N/A   N/A   N/A 
1  82645144000160   NaN   NaN   NaN 

当进入第二轮合并时,系列看起来像这样:

s (second round):

A                                  N/A
B                                  N/A
C                                  N/A
cnpj                    82645144000160

但合并变得一团糟,就像这样:

             cnpj   A_x   B_x  C_x  A_y  B_y  C_y
0  33062217000185   N/A   N/A  N/A  NaN  NaN  NaN
1  82645144000160   NaN   NaN  NaN  N/A  N/A  N/A

如果我尝试使用df.merge(s.to_frame().T.astype({'cnpj' : 'int'}), how='left',on='cnpj').fillna('')更改合并,则会收到以下错误:

ValueError: entry not a 2- or 3- tuple

有人可以帮忙吗?

2 个答案:

答案 0 :(得分:2)

<强>设置

df = pd.DataFrame({'cnpj': [33062217000185, 82645144000160]})
print(df)
             cnpj
0  33062217000185
1  82645144000160

s = pd.Series(['N/A', 'N/A', 'N/A', 33062217000185], index=['A', 'B', 'C', 'cnpj'])
print(s)
A                  N/A
B                  N/A
C                  N/A
cnpj    33062217000185
dtype: object

使用df.merge,将s转换为数据框并在流程中进行转置。

df.merge(s.to_frame().T\
      .astype({'cnpj' : 'int'}), how='left').fillna('')
             cnpj    A    B    C
0  33062217000185  N/A  N/A  N/A
1  82645144000160  

答案 1 :(得分:0)

获取一些@COLDSPEED提示并使用concat而不是合并或加入它最终有效。

peers=peer_comparison(df.cnpj[0])
for i in df.cnpj[1:]:
    peers2=peer_comparison(i,base_year)
    peers=pd.concat([peers,peers2],axis=1)

df=peers.T