使用合并的单元格读取非ascii excel,其中**实际为NA

时间:2018-11-21 03:04:53

标签: python excel pandas csv encoding

我试图使用包含大量合并单元格(每列异步)的xlsx从大型pandas文件中读取数据。我已经在这里阅读了类似的问题:

  

Pandas: Reading Excel with merged cells

但是我的文件包含NA (即空单元格)。如果我在该问题中使用解决方案,则NA单元将被其上方的内容填充,这对于该数据至关重要。

我在此计算机上安装了Excel 2013。我尝试将Saving as的文件命名为csvUnicode Text,但由于以下原因,该文件也无效:

  • 合并的单元格将无法正确保存(即无法填充)

  • 该文件是用中文编写的(即非ASCII,可能是GB2312)。将非ASCII Excel文件保存为非Excel格式存在很多问题。 Excel无法打开自己保存的csv文件(它报告failed to open broken SYLK file或简单的显示垃圾)。 Notepad ++可以打开它,但是某些文本变成不可读的垃圾。我尝试将Encoding中的Web Options选项更改为UTF-8UnicodeGB2312GBK等,但是它们都不起作用。

我想知道如何使用 实际不适用的合并单元格读取非ASCII excel?非熊猫或excel方面的解决方案也可以,但python方面的解决方案将受到更多欢迎。

谢谢!

0 个答案:

没有答案