文档预处理库

时间:2012-09-09 08:58:16

标签: itext apache-poi java

我正在寻找文档预处理的库(和指南)。我的意思是,例如生成PDF,MS Office(Excel / Word),Open Office格式文件。

我已经看到有流行的特别是Apache POI和iText。 您是否知道任何描述doc预处理库的书籍(对于iText我发现“iText in Action”)?

我也想比较一下库。

任何线索?

1 个答案:

答案 0 :(得分:0)

对于文件格式本身,许多细节可在线获取。我不知道有哪些书。但是这里有一些办公文档文件格式的在线参考。

对于Microsoft Office文档(Word,Excel,PowerPoint),将发布格式 http://www.microsoft.com/openspecifications/en/us/programs/osp/office-file-formats/default.aspx 要么 http://msdn.microsoft.com/en-us/library/cc313105%28v=office.12%29.aspx

Microsoft站点包含一些如何解析Office类型文件的示例,这可能对您有用。

对于Open Office,你可以看一下 http://www.openoffice.org/xml/general.html 要么 https://www.oasis-open.org/committees/tc_home.php?wg_abbrev=office

但是上面的内容更像是参考手册而不是教程或库,可以让您轻松地解析这些文档。