什么是从word,rtf,ecc获得docbook的最佳解析器

时间:2011-08-31 11:13:23

标签: xml parsing html-parsing xml-parsing docbook

我需要知道什么是我的问题的最佳解决方案。

我想创建一个接收word文件(或任何其他富文本格式)的Docbook编辑器,并允许您修改内容/样式以构建docbook。

基本上在这个问题上,我想研究一下实现这个结果的最佳选择。

更好吗?
-> upload the file
-> parse it to docbook 
-> transform it to xhtml 
-> modify with wysiwyg editor
-> save changes to docbook

-> upload the file
-> transform it to xhtml syntax
-> modify the xhtml with a wysiwyg editor
-> convert xhtml to docbook

请将解决方案与一些可以帮助我这样做的工具/库/程序联系起来(如果可能的话)。

1 个答案:

答案 0 :(得分:1)

验证后,DocBook XSL允许您转换(特别是):

  • DocBook XML Word XML
  • Word XML DocBook XML
  • DocBook XML XHTML

认为你有一般的解决方案。可以使用大量编程语言处理XSLT。

至于你的两个过程,我理解不同的是,在第二个过程中,你试图只检测XHTML中的修改以在DocBook XML中反映它们。使用XSL完全转换它可能更容易。

我认为您应该告诉我们您正在创建的应用程序的上下文,然后我们可以了解其固有的局限性并更好地校准我们的答案。

编辑:您可以鼓励自己甚至将其作为解决方案:Oxygen XML Editor。见http://www.oxygenxml.com/docbook_editor.html

此编辑器可以在WYSIWYG中编辑DocBook,并以多种方式导入/导出它。

有一个作者版本,更简单,它将完成所有这些。