Python:当文件在列标题中包含特殊字符时,使用Pandas读取Excel文件

时间:2014-09-23 04:56:51

标签: python excel pandas xls xlsx

我知道您可以使用pandas读取Excel文件,但我在阅读工作表中的列标题不像普通文本那样易于阅读的文件时遇到了问题。

换句话说,如果列标题有特殊字符,则文件将无法导入。如果您将这样的数据导入Microsoft Access或其他数据库,您可以选择导入或删除特殊字符。

我唯一的解决办法就是编写一个Excel宏来删除导入时数据库通常不喜欢的字符 - 然后使用python导入文件。

但是必须有一种方法来处理这种情况纯粹使用python(这要快得多)。

我的问题是,当列标题包含不能导入的特殊字符时,python如何处理导入.xls和.xlsx文件?

1 个答案:

答案 0 :(得分:0)

在字符串前添加“u”。例如,如果您要在数据框“df”中查找名为“lissé”的列,那么您应该输入df [u'lissé']