我正在使用pandas和python为具有相同数据的列处理具有不同列名的多个文件。
dataset = pd.read_csv('Test.csv', index_col=0)
cols= dataset.columns
我在列表中有不同的列标题。
AddressCol=['sAddress','address','Adrs', 'cAddress']
有没有办法将所有可能的列名称规范化为pandas中的“Address”,以便我在不同的文件上使用该脚本?
如果没有pandas,我会使用类似double for循环的方法来浏览列名列表和可能的列名以及if语句来提取整个数组。
答案 0 :(得分:6)
您可以使用rename DataFrame方法:
dataset.rename(columns={typo: 'Address' for typo in AddressCol}, inplace=True)