创建一个Word(.doc)文件,将其转换为PDF和HTML,无需打开Open Office端口

时间:2011-02-11 12:20:41

标签: java jsp servlets openoffice.org

我有一个项目需要创建一个Word(.doc)文件,其中包含从我的数据库中获取的某些格式和某些数据。我想将该文件输出到他要编辑的用户,然后将文件上传回服务器。之后我想对上传的文件执行以下转换。

  • .doc to .pdf (拟在网上下载和查看)
  • .doc to .html (适用于网络上的免费文字搜索)

我想在不打开Open Office端口的情况下实现这一目标。早期版本正在这样做但是当用户更多时,打开的端口有崩溃的趋势。所以我想避免这样做。 Open Office和操作系统都重新安装在其他机器上并以不同的方式进行尝试,但每次用户增加时OO端口都会崩溃。

有没有其他方法可以实现这种转换?由于崩溃,不可能继续这样做。

这是主机:

  • Linux上的Tomcat服务器(RedHat 64位)
  • 该应用程序是用Java(JSP和Servlets)开发的
  • 后端是Oracle

所有用户都有:

  • Linux机器,主要是32位Fedora或Suse

感谢任何帮助。

1 个答案:

答案 0 :(得分:1)

您可以使用http://poi.apache.org/来处理实际的.doc文件。对于PDF,还有许多PDF库可用。问题是很多都不是免费的,但这里有一个开源PDF库列表:http://java-source.net/open-source/pdf-libraries

以下是Word到HTML的讨论。 Convert Word doc to HTML programmatically in Java