将XML或HTML转换为Wiki标记 - 您会选择哪种方法?

时间:2009-10-29 10:40:34

标签: java php perl scripting scripting-language

我需要将HTML文档(从DocBook XML文档生成)转换为Wiki标记语言,特别是PM Wiki标记语言。目标是在我们新创建的wiki中包含公司的应用程序操作指南。这意味着我实际上有两个选择:

  1. 将HTML(从DocBook XML生成)转换为wiki
  2. 将Docbook XML直接转换为wiki
  3. 由于HTML是由DocBook到HTML转换器生成的,因此在HTML文档中定义标记的方式变化不大,只有文档的内容。

    我正在寻找一种可以由我自己快速实施的解决方案。我将不得不进行一次转换,然后每次创建新版本的应用程序操作指南。

    到目前为止我想到的解决方案:

    1. 使用Perl或PHP脚本将HTML转换为wiki,基于正则表达式。
    2. 将Docbook XML直接转换为wiki。由于它是XML,我可以使用Java进行XML解析。这里的风险是我不熟悉DocBooks XML格式(就像我使用HTML一样),所以这需要一些时间来学习。
    3. 您会选择哪种方法进行这项工作?

      更新

      我刚刚尝试了名为ConvertHTML的PMWiki扩展程序。它不能很好地工作,因为它没有转换HTML标签(例如,没有像维基中那样转换),因为它的文档说:

      PmWiki标记不支持所有HTML标记,因此无法进行100%转换。但是,PmWiki可以在编辑或保存文本时替换文本。 ConvertHTML实现了一组相对全面的规则,用于将HTML标记转换为wiki标记。

3 个答案:

答案 0 :(得分:4)

This可能有用,虽然它可以从DocBook转换为MediaWiki,而不是PM Wiki。

有Perl模块可以将HTML转换为各种Wiki方言:HTML::WikiConverter。因此,如果您可以将DocBook转换为HTML,那么这也可能有用。

答案 1 :(得分:1)

我使用Digester从简单的XML文件生成Java对象,并通过Java修改它以满足我的需求。这是一个非常简单的使用工具。也许你想尝试一下。为我工作..

答案 2 :(得分:0)