所以我尝试将多个 Excel 文件(大约有 20 个不同的)合并,清理数据然后使用 Python 导出结果到一个单独的 Excel 文件中。
这些 Excel 文件看起来像这样:
产品成本 性别 是否为主打商品
名称 价格 男 是 / 否
名称 价格 女 是 / 否
... 等等
以下是我的代码:
import pandas as pd
import pathlib
desktop_dir = pathlib.Path(r'C:/users/"myname"/Desktop')
files = desktop_dir.glob('*.XLSX')
data = []
for file in files:
df = pd.read_excel(file)
data.append(df)
df = pd.concat(data)
print(df)
array = df.to_numpy().tolist()
clean_array = [x[:-1] for x in array if x[1]<=20 and x[2] == "male" and x[-1]=='yes']
print(clean_array)
result = pd.DataFrame(clean_array)
result.to_excel('clean_data.xlsx')
现在代码已经可以工作了,但是“clean_data.xlsx”结果 Excel 文件中没有四个标题名称(产品成本、性别、是否为主打商品),我不确定如何添加它们而不手动输入。
请帮助我修复代码吗?感谢您的帮助。