读取,选择和重新排列Pandas中的列

时间:2018-12-07 20:47:38

标签: python excel python-3.x pandas python-2.7

我有一个最佳实践问题。今天,我学习了如何在Pandas中读写文件。如何创建表,如何添加列和行以及如何删除它们。

我有一个包含以下内容的excel文件:

enter image description here

我创建一个新列“ Price_average”,然后对“ Price_min”和“ Price_max”取平均值,并将其输出为output_1.xlsx

    #!/usr/bin/env python3

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import xlrd


df = pd.read_excel('original.xlsx')
print (df)

df['Price_average'] = (df.Price_min + df.Price_max)/2

df.to_excel('output_1.xlsx', sheet_name='sheet1', index=False)
print (df)

enter image description here

然后,我在“ Price_min”和“ price_max”列中添加以下内容:

df = df.drop(['Price_min', 'Price_max'], axis=1)

enter image description here

并且可以说我想立即创建此表:

enter image description here

我可以删除“年龄”和“价格平均值”,然后将“电子邮件”替换为“品牌”,或者我可以简单地选择要创建新电子表格的列?

什么是最好,最干净的方法?要从文件中减去不需要的列并重新排列,如果需要,可以重命名列或选择并选择所需的列,并以正确的顺序创建一个新文件。有什么建议么?解决问题的最干净的方法是什么?

1 个答案:

答案 0 :(得分:1)

您可以尝试一下,

selected = df[['Age', 'Price_average', 'Email', 'Brand']]

如果要更改列名,

renamed = selected.rename(columns={'Brand': 'brand', 'Email':'email'})