Pandoc掉落"未知"转换为markdown时的HTML元素

时间:2014-11-13 01:48:22

标签: html markdown pandoc

考虑以下简单的HTML:

<!DOCTYPE html>
<body>
<p>Test
  <object height="355" width="425">
    <param name="movie" value="http://www.youtube.com/v/DKk9rv2hUfA&amp;rel=1">
    <param name="wmode" value="transparent">
    <embed height="355" src="http://www.youtube.com/v/DKk9rv2hUfA&amp;rel=1" type="application/x-shockwave-flash" width="425">
  </object>
</p>
</body>

我希望将其转换为markdown,以及不具有降价等值(object等)的元素,以便在HTML不变的情况下将它们传递给它们。但是,当我使用以下命令行通过pandoc(v1.13.1)运行它时:

pandoc --from=html --to=markdown --output=C:\Temp\test.md C:\Temp\test.html

...我在test.md中获得的唯一输出是:

Test

我显然缺少一些参数,或者这是否可能?我认为markdown允许将半任意HTML嵌入内联。

注意:我已经看过this question and answer,但是当我尝试--parse-raw时,它只是通过全部将HTML作为HTML传递,这是不是我想要的。

1 个答案:

答案 0 :(得分:1)

--parse-raw参数确实是您正在寻找的。例如:

$ echo '<h1>foo</h1><p>bar <object>baz</object></p>' | pandoc -f html -t markdown --parse-raw
foo
===

bar <object>baz</object>

但是,它似乎会阻塞示例中的<embed>标记,从而将外部<p>标记留在原位,而不是将其转换为markdown。您应该提交错误报告。