Java - 将doc / docx文件转换为chm文件

时间:2012-05-02 11:03:42

标签: java docx doc chm

我想知道将Word文档(.doc / .docx)文件转换为帮助文件(.chm)格式。我想用Java来转换文件。我的公式很简单。要在Word文档中创建目录页面和其他链接,作为包浏览器或文件浏览器,使用户导航更简单,更快速,更容易在文档中的页面之间导航。

所以,我的问题是:

java中是否有可导入并用于文件转换的本机库?

请分享您的想法以实施上述概念。

2 个答案:

答案 0 :(得分:6)

在Java中完成这项任务非常困难。但是,如果安装Microsoft HTML Help Workshop,您仍然可以这样做。

  1. 首先,您可以通过Apache POI提取Word文档的文本,然后将它们作为HTML文档输出到临时目录。
  2. 接下来,您需要创建一个HHP文件。它应该相当容易创建,因为它是一个文本文件。只需遵循here
  3. 给出的规范即可
  4. 那么你也应该有一个相应的HHC文件。它是一个简单的HTML文档,格式如下:

    <html>
    <head>
    </head>
    <body>
    <ul>
    <li><object type="text/sitemap">
    <param name="Name" value="Foo Directory">
    <param name="Local" value="BarDirectory/index.htm">
    <param name="ImageNumber" value="1">
    </object></li>
    <ul>
    <li><object type="text/sitemap">
    <param name="Name" value="Topic1">
    <param name="Local" value="BarDirectory/Bar.htm">
    <param name="ImageNumber" value="11">
    </object></li>
    <li><object type="text/sitemap">
    <param name="Name" value="Topic1">
    <param name="Local" value="BarDirectory/Foo.htm">
    <param name="ImageNumber" value="11">
    </object></li>
    </ul>
    </ul>
    </body>
    </html>
    

    同样查找HHK文件的结构。

  5. 完成后,您可以从Java执行hhc.exe <inputfile.hhp>。那应该可以胜任。

答案 1 :(得分:0)

不是我知道或者我能找到的。但是,相反,制作一个为您完成所有工作的java程序,如果您要手动操作所需的软件,那该怎么办呢?只需发送命令并让它为您完成。我会提供一些代码,但我还没有在java中完成这个。

另一种方法是在VBscript中执行它,调用某些java类来运行,并使用VBScript向程序发送击键。这种方法的唯一缺点就是你无法在它中运行它。背景,并且在完成之前无法使用您的计算机。