我正在使用pandas.read_excel将excel文件导入DataFrame。 这是守则......
class MyCustomView<T extends Number> {
...
}
这会导入文件,但会出现以下警告......
警告*** OLE2流&#39; SSCS&#39;:预期大小128640,实际大小512
当我打印数据框时,我发现最后一列的值完全错误(而不是该列的实际值,每行显示4个。
答案 0 :(得分:2)
如果您使用的是Windows,则可以使用Excel本身修改所有XLS文件,然后再使用Pandas加载它们。以下脚本将自动取消隐藏给定文件夹中找到的所有XLS文件中的所有列:
import win32com.client as win32
import glob
excel = win32.gencache.EnsureDispatch('Excel.Application')
for xls in glob.glob(r"C:\My Path\*.xls"):
print xls
wb = excel.Workbooks.Open(xls)
ws = wb.Worksheets(1)
ws.Columns.EntireColumn.Hidden = False
excel.DisplayAlerts = False # Allow file overwrite
wb.Close(True)
excel.Application.Quit()
您可能希望在执行此操作之前复制XLS文件,因为它将在适当的位置完成。或者,您可以使用wb.SaveAs()
指定不同的输出位置。