HTML到RST转换器

时间:2016-09-11 11:44:23

标签: html xml scikit-learn restructuredtext

我有很多使用docutils转换为HTML的RST(reStructuredText)文件。 使用小型开发的JS应用程序(具有HTML5 contenteditable属性的基本iframe),非技术人员可以轻松编辑生成的HTML页面。目标是将HTML中完成的修改应用回原始RST文件。

我想知道是否有办法训练具有original_RST的基本事实的算法 - > outputed_HTML转换,以便我们以后可以将outputed_HTML +次要修改反转回RST?它会是什么样的算法?我应该从哪个方向开始挖掘?

为了简化问题,我还可以使用docutils的内部XML AST表示作为文档输入(RST到XML-AST:http://docutils.sourceforge.net/tools/quicktest.py)而不是RST,然后修复xml2rst + xslt项目({ {3}})

欢迎任何建议

1 个答案:

答案 0 :(得分:1)

尝试Pandoc

  

如果您需要将文件从一种标记格式转换为另一种标记格式,那么pandoc就是您的瑞士军刀。