我正在使用pd.ExcelFile.
将excel文件读入熊猫
它读取正确,我可以打印数据框。但是当我尝试选择诸如以下列的子集时:
subdf= origdf[['CUTOMER_ID','ASSET_BAL']]
我收到错误消息:
KeyError: "['CUTOMER_ID' 'ASSET_BAL'] not in index"
我需要在这里定义某种索引吗?当我打印df时,我验证了其中的列。
答案 0 :(得分:2)
确保这些列实际上存在于数据框中。例如,您写的是CUTOMER而不是CUSTOMER,我认为这是正确的名称。
您可以使用list(origdf.columns.values)
来验证列名。