Pandoc - HTML to Markdown无法正确处理嵌套的无序列表

时间:2015-06-09 08:28:22

标签: html nested html-lists markdown pandoc

我正在尝试使用Pandoc将嵌套的无序HTML列表转换为Markdown。 HTML文档中的嵌套列表格式为:

<ul> <li>outer list item</li> <li>outer list item</li> <li>outer list item</li> <ul> <li>inner list item</li> <li>inner list item</li> <li>inner list item</li> </ul> <li>outer list item</li> <li>outer list item</li> </ul>

我用来将HTML转换为Markdown的命令是:

pandoc -o output.md input.html

我在生成的Markdown文件中得到的结果是:

outer list item

outer list item

outer list item

- inner list item - inner list item - inner list item

outer list item

outer list item

outer list item

因此外部列表未在Markdown中转换为无序列表。我已经尝试将--parse-raw选项(请参阅http://pandoc.org/README.html#pandocs-markdown)传递给Pandoc,外部HTML作为原始HTML传递到Markdown文档中,表明由于某种原因,外部HTML是不可翻译的。

有没有人知道为什么这不起作用?

谢谢, 加里

1 个答案:

答案 0 :(得分:2)

您的HTML无效,应该是:

<ul>
    <li>outer list item</li>
    <li>outer list item</li>
    <li>outer list item</li>
    <li>
      <ul>
        <li>inner list item</li>
        <li>inner list item</li>
        <li>inner list item</li>
      </ul>
    </li>
    <li>outer list item</li>
    <li>outer list item</li>
</ul>