将Word表转换为内存中的HTML

时间:2012-03-20 20:43:32

标签: html ms-word

由于Word对合并单元的奇怪管理,很难确定Word中的合并单元格(从技术上讲,单元格上没有合并属性,它只是一种方法,因此我们必须“猜测”合并的内容)。

虽然不完美,但我发现了一种帮助确定合并单元格的方法。如果将.docx文件另存为filtered html file(。htm),则可以查看.htm文件中的标记,并查看每个单元格的colspan属性。

我想避免首先将.docx保存为.htm(使用Document.SaveAs方法),然后解析.htm来确定每个单元格的colspan值。

有没有我可以直接以.htm格式将表格保存到内存中然后从那里拉取值?

另一种选择可能是使用会话用来确定colspan的算法,但我没有在互联网上找到任何关于它的内容,我想尽可能避免自己编写复杂的算法。

0 个答案:

没有答案