在Python中使用熊猫打开已损坏的.xls文件

时间:2020-02-06 03:47:47

标签: python-3.x pandas xls cognos

这就是问题所在,我正在尝试从 COGNOS 下载的文件中导入DF。在cognos中,我选择 .CSV 格式,但始终下载该格式为 .xls

打开.xls文件并将其另存为CVS将非常容易,但是问题在于该文件具有比excel更多的行,因此在此过程中我将丢失很多数据。另外,当我在excel中打开文件时,这是警告文件可能已损坏。

当我尝试使用df = pd.read_excel("Time Series 2018-1.xls")打开数据时,它显示了以下问题。

XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\xff\xfeP\x00r\x00o\x00'

请帮助

2 个答案:

答案 0 :(得分:0)

您可以尝试

  1. 更改文件名,删除空格和破折号,然后重试
  2. 跟着这名熊猫官员link

答案 1 :(得分:0)

我已经解决了。只需打开文件即可,并以 UTF-8 编码保存。然后只需用df = pd.read_csv("Prueba1.xls", sep = "\t", encoding = 'utf8')打开它,因为正如@dougp所说的,只是一个扩展名为xls的csv文件。

我想有一种方法可以更改PYTHON中的编码,但这是另一个问题。