使用Java将数据从ODT提取到PDF

时间:2014-04-22 07:00:59

标签: java pdf data-extraction odt

我想在java中获取ODT文件的数据。为此目的,我有两种方法。

1)。我从ODT文件中获取提取数据并创建一个新文档

2)。获取odt文档的打印预览,并将其作为this

等图像添加到PDF文档中

您能否建议哪种方法更好,我该怎么做?

2 个答案:

答案 0 :(得分:0)

最后我使用了第三种方法。在搜索我的答案时,我偶然发现了一个JAVA库,用于我的目的XdocReport。我使用ODT和DOCX转换器将ODT / DOCX转换为PDF格式。

答案 1 :(得分:0)

对于提取:  1)您可以使用纯Java,解压缩文件并处理(主要是)content.xml文件。  2)您可以使用LibreOffice Java SDK创建到LibreOffice的桥梁并以编程方式提取文本。 SDK中有执行此操作的示例代码。

对于转换:  1)您可以从命令行执行此操作(再次使用Libre Office):    办事处-转换为pdf  2)您可以像上面#2一样使用SDK以编程方式驱动它。我有一段时间写过一个博客Converting Documents to PDF,该博客以Doc输入(但ODT相同)为例,展示了一个示例。

这取决于您要执行的频率,性能限制等。