我应该使用哪种技术将我的乳胶文档转换为html文档

时间:2010-06-08 15:41:25

标签: html parsing latex

我想编写一个将我的TeX文件转换为HTML的小程序。我想解析文档并将宏(内置,当然还有我自己的)转换成HTML片段。以下是我的要求:

  • 预定义规则(例如begin{itemize} \item text \end{itemize} =&gt; <br> <p>text </p> <br/>
  • 定义自己的CSS样式
  • 转换配方奶粉的能力(提取配方奶粉,将它们装入imagecreator然后保存jpg / png)
  • 易于维护和简洁

我知道有几种技术,但我不知道哪种技术最适合我。以下是流入我脑海的技术

  1. Ruby(I / O很简单,通过webrat进行公式加载),
  2. XML XSLT(我认为我不需要开销)
  3. perl(那里有很多库,但我对它不太熟悉)
  4. bash(我和sed一起工作,很惊讶使用正则表达式是多么容易)
  5. latex2html ...(这些转换器不适合我,他们不会给我解析的自由)
  6. 欢迎任何建议,提示和评论。

    感谢您的时间,伙计们。

2 个答案:

答案 0 :(得分:2)

看看pandoc here。它也可以安装在linux或os x上。虽然它不会做你的自定义宏。我唯一看到的可以用自定义宏做一个不错的工作是tex4ht,但要真正运行良好,你需要生成.DVI文件。如果你有大量的自定义宏,编写自己的转换器将花费大量的时间。即使你只有一些自定义宏,它仍然会很痛苦。祝你好运!

答案 1 :(得分:0)

六:TeX

七:Haskell

(我放弃试图说服SO开始从6开始编号)。