我们目前正在使用.xml文件作为输入使用XSL-FO转换生成所有官方文档,并生成.pdfs&基本上这些.xml中的所有内容都是纯文本或xhtml。这对于日常用例来说非常好用,但是我们的一些用户会引用我们的XSL-Fo变换器(Antenna House)本身无法处理的Microsoft Excel文件(并且afaik,其他人也没有这样做)。
因此,我们作为中间短期解决方案所做或正在做的是,我们使用用户定义的印刷品创建图像,并将这些图像嵌入.pdfs中。
然而,由于这些图像显然不是“可搜索”的内容明智,我们正在查看OCR的这些.pdfs等等的后处理步骤,但在我看来,这一切都深入到了解决方法的漏洞
我有想法将这些.xls文件转换为SpreadsheetML并用我们的xsl-fo样式表来覆盖它,但是看看电子表格规格我有点放弃了这个希望......至少没有浪费几十个人月实施。
那么,为了解决我的实际问题,您在xsl-fo驱动的文档生成中如何处理Microsoft Excel文件?
干杯&谢谢, -J
答案 0 :(得分:1)
您的.xls文件是否包含公式?如果不是只使用fo中的表,行和单元格标记将xlsx转换为xsl-fo。从未在xml中查看带有公式的xlsx文件。让我想知道你是否可以将Excel文档保存为“可见”而没有公式只是结果?有点像“打印出色”?
答案 1 :(得分:0)
您可以将Excel文件转换为PDF,然后合并生成的文档。它不是直接通过XSL-FO处理。
就个人而言,我甚至不会尝试将Excel文件存储在PDF中,我会从PDF链接到它。 Excel是封闭的,非常复杂,对于打开的部分(新的XML格式),它仍然(通常)包含二进制blob及其移动目标。我不认为这场战争值得战斗。
答案 2 :(得分:0)
Windward Docgen完全符合您的要求。使用Windward,您可以在Word,Excel或PowerPoint中设计文档,然后我们的引擎将该模板与数据合并以创建最终文档。该引擎在Java和.NET中可用,并且不在服务器上使用Office,因此速度非常快,并且在嵌入Excel并评估所有宏的情况下为您提供最终PDF。 (免责声明 - 我是Windward的首席技术官。)