Question

我有一个最佳实践问题。今天，我学习了如何在Pandas中读写文件。如何创建表，如何添加列和行以及如何删除它们。

我有一个包含以下内容的excel文件：

我创建一个新列“ Price_average”，然后对“ Price_min”和“ Price_max”取平均值，并将其输出为output_1.xlsx

    #!/usr/bin/env python3

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import xlrd


df = pd.read_excel('original.xlsx')
print (df)

df['Price_average'] = (df.Price_min + df.Price_max)/2

df.to_excel('output_1.xlsx', sheet_name='sheet1', index=False)
print (df)

然后，我在“ Price_min”和“ price_max”列中添加以下内容：

df = df.drop(['Price_min', 'Price_max'], axis=1)

并且可以说我想立即创建此表：

我可以删除“年龄”和“价格平均值”，然后将“电子邮件”替换为“品牌”，或者我可以简单地选择要创建新电子表格的列？

什么是最好，最干净的方法？要从文件中减去不需要的列并重新排列，如果需要，可以重命名列或选择并选择所需的列，并以正确的顺序创建一个新文件。有什么建议么？解决问题的最干净的方法是什么？

Answer 1

您可以尝试一下，

selected = df[['Age', 'Price_average', 'Email', 'Brand']]

如果要更改列名，

renamed = selected.rename(columns={'Brand': 'brand', 'Email':'email'})

读取，选择和重新排列Pandas中的列

1 个答案: