我希望能够获取现有的HTML代码段并将其转换为markdown。 为此我试过pandoc:
pandoc test.html -o test.md
test.html看起来像这样:
Hello
<!-- more -->
and some more text
<h2>some heading</h2>
结果如下:
Hello and some more text
some heading
------------
因此,它不仅可以转换在降价中具有直接含义的标签。它还删除了我想要保留为HTML的标记(例如,HTML评论,iframe
标记等等。)
特别是,我对命令行程序选项感兴趣。例如,也许有可以提供给pandoc的选项。
答案 0 :(得分:20)
经过一番搜索后,我了解了thread on table parsing中的--parse-raw
选项。
添加--parse-raw
选项似乎不会删除非降价等效的HTML标记。
pandoc test.html -o test.md --parse-raw