Question

我正在使用pandas和python为具有相同数据的列处理具有不同列名的多个文件。

dataset = pd.read_csv('Test.csv', index_col=0)

cols= dataset.columns

我在列表中有不同的列标题。

AddressCol=['sAddress','address','Adrs', 'cAddress']

有没有办法将所有可能的列名称规范化为pandas中的“Address”，以便我在不同的文件上使用该脚本？

如果没有pandas，我会使用类似double for循环的方法来浏览列名列表和可能的列名以及if语句来提取整个数组。

Answer 1

您可以使用rename DataFrame方法：

dataset.rename(columns={typo: 'Address' for typo in AddressCol}, inplace=True)