Pandoc:HTML-to-Markdown - 我可以使用模板或脚本替换元素吗?

时间:2016-01-15 19:02:16

标签: markdown pandoc

我已成功将HTML转换为Markdown,但<span class="cmd">等元素会保留并显示在MD结果中。

有没有办法(可能是使用模板或Pandoc脚本)用<span>替换<strong>元素,或者在HTML-to-Markdown转换过程中用星号替换?

例如:

我想替换

<span class="cmd">This content must be bold</span>

<strong>This content must be bold</strong>

*This content must be bold*

非常感谢。

1 个答案:

答案 0 :(得分:2)

您可以调整this pandoc filter。将其另存为cmd_italics.py并运行pandoc myfile.html -o myfile.md -F cmd_italics.py

#!/usr/bin/env python

from pandocfilters import toJSONFilter, Strong


def cmd_italics(key, value, format, meta):
    if key == 'Span':
        [[ident, classes, kvs], contents] = value
        for c in classes:
            if c == "cmd":
                return Strong(contents)

if __name__ == "__main__":
    toJSONFilter(cmd_italics)

您需要安装pandocfilter python library