Question

我正在使用pd.ExcelFile.将excel文件读入熊猫它读取正确，我可以打印数据框。但是当我尝试选择诸如以下列的子集时：

subdf= origdf[['CUTOMER_ID','ASSET_BAL']]

我收到错误消息：

 KeyError: "['CUTOMER_ID' 'ASSET_BAL'] not in index"

我需要在这里定义某种索引吗？当我打印df时，我验证了其中的列。

Answer 1

确保这些列实际上存在于数据框中。例如，您写的是CUTOMER而不是CUSTOMER，我认为这是正确的名称。

您可以使用list(origdf.columns.values)来验证列名。