我试图使用包含大量合并单元格(每列异步)的xlsx
从大型pandas
文件中读取数据。我已经在这里阅读了类似的问题:
但是我的文件包含NA (即空单元格)。如果我在该问题中使用解决方案,则NA单元将被其上方的内容填充,这对于该数据至关重要。
我在此计算机上安装了Excel 2013。我尝试将Saving as
的文件命名为csv
或Unicode Text
,但由于以下原因,该文件也无效:
合并的单元格将无法正确保存(即无法填充)
该文件是用中文编写的(即非ASCII,可能是GB2312
)。将非ASCII Excel文件保存为非Excel格式存在很多问题。 Excel无法打开自己保存的csv
文件(它报告failed to open broken SYLK file
或简单的显示垃圾)。 Notepad ++可以打开它,但是某些文本变成不可读的垃圾。我尝试将Encoding
中的Web Options
选项更改为UTF-8
,Unicode
,GB2312
,GBK
等,但是它们都不起作用。
我想知道如何使用 实际不适用的合并单元格读取非ASCII excel?非熊猫或excel方面的解决方案也可以,但python方面的解决方案将受到更多欢迎。
谢谢!