Question

我正在尝试合并两个数据框。 “ df”是我的初始数据帧，其中包含我需要的所有标头信息。 “行”是我要附加到“ df”的第一行数据。

(?<=")[Ee]th.*?(?=")

我正在尝试创建它：

df =
   FName E1         E2          E3          E4          E5          E6
0  Nan   2          2           2           2           2           2
1  Nan   1          1           1           1           1           1
2  Nan   3          4           5           6           7           8
3  Nan   4          5           6           7           8           10
4  Nan   1002003004 1002004005  1002005006  1002006007  1002007008  1002008010


row =
   0                                        1       2       3       4       5       6
0  501#_ZMB_2019-04-03_070528_reciprocals   30.0193 30.0193 30.0193 34.8858 34.8858 34.8858

我尝试了以下方法：

   FName                                    E1          E2          E3          E4          E5          E6
0  Nan                                      2           2           2           2           2           2
1  Nan                                      1           1           1           1           1           1
2  Nan                                      3           4           5           6           7           8
3  Nan                                      4           5           6           7           8           10
4  Nan                                      1002003004  1002004005  1002005006  1002006007  1002007008  1002008010
5  501#_ZMB_2019-04-03_070528_reciprocals   30.0193     30.0193     30.0193     34.8858     34.8858     34.8858

和

df = df.append(row, ignore_index=True)

这两种情况都会导致第一个df中的所有数据丢失，该数据应包含所有标头信息。

df = pd.concat([df, row], ignore_index=True)

我也尝试过

   0                                        1       2       3       4       5       6
0  Nan                                      Nan     Nan     Nan     Nan     Nan     Nan
1  Nan                                      Nan     Nan     Nan     Nan     Nan     Nan
2  Nan                                      Nan     Nan     Nan     Nan     Nan     Nan
3  Nan                                      Nan     Nan     Nan     Nan     Nan     Nan
4  Nan                                      Nan     Nan     Nan     Nan     Nan     Nan
5  501#_ZMB_2019-04-03_070528_reciprocals   30.0193 30.0193 30.0193 34.8858 34.8858 34.8858

产生了以下回溯

df = pd.concat([df.reset_index(drop=True, inplace=True), row.reset_index(drop=True, inplace=True)])

有人知道我在做什么错吗？

Answer 1

串联更多行时，pandas对齐当前不重叠的列。 rename将完成工作：

pd.concat([df, row.rename(columns=dict(zip(row.columns, df.columns)))],
           ignore_index=True)

                                    FName          E1          E2          E3          E4          E5          E6
0                                     Nan           2           2           2           2           2           2
1                                     Nan           1           1           1           1           1           1
2                                     Nan           3           4           5           6           7           8
3                                     Nan           4           5           6           7           8          10
4                                     Nan  1002003004  1002004005  1002005006  1002006007  1002007008  1002008010
5  501#_ZMB_2019-04-03_070528_reciprocals     30.0193     30.0193     30.0193     34.8858     34.8858     34.8858

或者，如果您只需要在末尾分配一行，并且在RangeIndex上有df：

df.loc[df.shape[0], :] = row.to_numpy()

串联熊猫数据框，获取第一个数据框的Nan值

1 个答案: