我将几个excel工作表合并到一个使用pandas的新工作簿中,如下所示:
我现在尝试使用python(用于练习)清理工作簿/数据框,方法是创建一个新列,其中等于表名,该名称列在“名称”上方的col [0]中。我知道如何在excel中做到这一点,但我正在尝试学习如何使用python转换数据。如果有帮助,数据集中当前有7051行。
最终结果将如下所示:
如果您对如何使用python进一步清理它有任何想法,请告诉我。我有excel解决方案,但我真的希望学习如何使用python。
用于组合工作表的代码示例:
import pandas as pd
import numpy as np
import os, collections, csv
from os.path import basename
df = []
f = 'ex_DATA.xlsx'
numberOfSheets = 22 #Modify this.
for i in range(1,numberOfSheets+1):
data = pd.read_excel(f, sheetname = 'TAB_'+str(i), header=None)
df.append(data)
final = "ex_DATA2.xlsx" #Path to the file in which new sheet will be saved.
df = pd.concat(df)
df = df.dropna(axis=0, how='all')
df.to_excel(final, header=None, index=None)