使用pandoc将html mathjax转换为markdown

时间:2013-04-15 12:04:23

标签: html mathjax pandoc

我有一些html文件,包括mathjax命令。 我想使用pandoc将其翻译成php额外降价。

问题是pandoc在所有数学命令之前添加“\”。例如 \开始{}方程 \ $ X \ ^ 2 等

你知道如何用pandoc避免这种情况吗? 我认为一个相关的问题就是这个问题:How to convert HTML with mathjax into latex using pandoc?

1 个答案:

答案 0 :(得分:2)

你可以写一个简短的Haskell程序unescape.hs:

-- Disable backslash escaping of special characters when writing strings to markdown.
import Text.Pandoc

main = toJsonFilter unescape
  where unescape (Str xs) = RawInline "markdown" xs
        unescape x        = x

现在使用ghc --make unescape.hs进行编译。和

一起使用
pandoc -f html -t json | ./unescape | pandoc -f json -t markdown

这将禁止在降价输出中转义特殊字符(如$)。

更简单的方法可能是通过sed管道pandoc的正常降价输出:

pandoc -f html -t markdown | sed -e 's/\\\([$^_*]\)/\1/g'