在R中使用pandoc将.docx转换为.md时,如何保留标题和副标题?

时间:2020-01-08 19:19:27

标签: r r-markdown pandoc bookdown

我要以.docx格式下载Google文档,然后转换为降价进行操作并导出为多种格式。

问题:当我使用pandoc进行转换时,它会去除标题(和字幕),并且不会添加任何YAML标头信息。我可以在标题中手动添加标题,但是我需要对它进行脚本化,因此(理想情况下)不必丢失标题或从docx中提取标题并添加到YAML标题中,然后将其连接到转换后的markdown文件中。 / p>

示例代码,其中从docx转换为markdown时标题丢失:

<ul class="nav1-1">
    <li ><a href="">1.1.</a></li>
    <li ><a href="">1.2</a>
        <ul class="nav1-2">
            <li><a href="">1.2.1</a></li>
            <li><a href="">1.2.2</a></li>
        </ul>
    </li>
    <li><a href="">1.3</a>
        <ul class="nav1-2">
            <li><a href="">1.3.1</a></li>
            <li><a href="">1.3.2</a></li>
        </ul>
    <li><a href="">1.4</a></li>
</ul>

1 个答案:

答案 0 :(得分:1)

从 docx 转换为 Markdown(或其他标记格式,如 rst)时,您需要包含 http://www.reddit.com/r/somepage.php?query=example -s 选项。

来自 pandoc documentation

<块引用>

-s, --standalone

使用适当的页眉和页脚生成输出(例如独立的 HTML、LaTeX、TEI 或 RTF 文件,而不是片段)。此选项是为 pdf、epub、epub3、fb2、docx 和 odt 输出自动设置的。对于本机输出,此选项会导致包含元数据;否则,元数据将被抑制。

如果没有 --standalone,此数据将被抑制。