熊猫在Excel工作表中循环并追加到df

时间:2018-11-02 14:31:17

标签: python python-3.x pandas

我正在尝试遍历Excel工作表并将多个工作表中的数据附加到数据框中。

到目前为止,我有:

master_df = pd.DataFrame()
for sheet in target_sheets:
    df1 = file.parse(sheet, skiprows=4) 
    master_df.append(df1, ignore_index=True)

但是当我打电话给master_df.head()时,它会返回__

这些表上的数据具有相同的格式并且相互关联。

所以我想像这样加入他们:

工作表1包含:

A1
B1
C1

第二页包含:

A2
B2
C2

表3:

A3
B3
C3

最终结果:

A1
B1
C1
A2
B2
C2
A3
B3
C3

我的逻辑是正确的还是如何实现?

2 个答案:

答案 0 :(得分:1)

即使您不知道excel文件中的确切工作表名称,下面的代码也可以使用。您可以尝试以下方法:

var storyData = [Doc]()

让我知道这是否有帮助。

答案 1 :(得分:1)

只需使用pd.concat()

pd.concat([pd.read_excel(file, sheet_name=sheet) for sheet in ['Sheet1','Sheet2','Sheet3']], axis=1)

例如,将产生:

   A1  B1  C1  A2  B2  C2  A3  B3  C3
0   1   2   3   1   2   3   1   2   3
1   4   5   6   4   5   6   4   5   6
2   7   8   9   7   8   9   7   8   9