pandas.read_excel导入列的错误值

时间:2017-03-10 08:44:13

标签: python excel pandas data-analysis

我正在使用pandas.read_excel将excel文件导入DataFrame。 这是守则......

class MyCustomView<T extends Number> {
    ...
}

这会导入文件,但会出现以下警告......

  

警告*** OLE2流&#39; SSCS&#39;:预期大小128640,实际大小512

当我打印数据框时,我发现最后一列的值完全错误(而不是该列的实际值,每行显示4个。

我附加了xls文件的屏幕抓取。 Sample Xls file 1st page screen grab

1 个答案:

答案 0 :(得分:2)

如果您使用的是Windows,则可以使用Excel本身修改所有XLS文件,然后再使用Pandas加载它们。以下脚本将自动取消隐藏给定文件夹中找到的所有XLS文件中的所有列:

import win32com.client as win32
import glob

excel = win32.gencache.EnsureDispatch('Excel.Application')

for xls in glob.glob(r"C:\My Path\*.xls"):
    print xls
    wb = excel.Workbooks.Open(xls)
    ws = wb.Worksheets(1)
    ws.Columns.EntireColumn.Hidden = False
    excel.DisplayAlerts = False     # Allow file overwrite
    wb.Close(True)

excel.Application.Quit()

您可能希望在执行此操作之前复制XLS文件,因为它将在适当的位置完成。或者,您可以使用wb.SaveAs()指定不同的输出位置。