我有一个最佳实践问题。今天,我学习了如何在Pandas中读写文件。如何创建表,如何添加列和行以及如何删除它们。
我有一个包含以下内容的excel文件:
我创建一个新列“ Price_average”,然后对“ Price_min”和“ Price_max”取平均值,并将其输出为output_1.xlsx
#!/usr/bin/env python3
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import xlrd
df = pd.read_excel('original.xlsx')
print (df)
df['Price_average'] = (df.Price_min + df.Price_max)/2
df.to_excel('output_1.xlsx', sheet_name='sheet1', index=False)
print (df)
然后,我在“ Price_min”和“ price_max”列中添加以下内容:
df = df.drop(['Price_min', 'Price_max'], axis=1)
并且可以说我想立即创建此表:
我可以删除“年龄”和“价格平均值”,然后将“电子邮件”替换为“品牌”,或者我可以简单地选择要创建新电子表格的列?
什么是最好,最干净的方法?要从文件中减去不需要的列并重新排列,如果需要,可以重命名列或选择并选择所需的列,并以正确的顺序创建一个新文件。有什么建议么?解决问题的最干净的方法是什么?
答案 0 :(得分:1)
您可以尝试一下,
selected = df[['Age', 'Price_average', 'Email', 'Brand']]
如果要更改列名,
renamed = selected.rename(columns={'Brand': 'brand', 'Email':'email'})