我要以.docx格式下载Google文档,然后转换为降价进行操作并导出为多种格式。
问题:当我使用pandoc进行转换时,它会去除标题(和字幕),并且不会添加任何YAML标头信息。我可以在标题中手动添加标题,但是我需要对它进行脚本化,因此(理想情况下)不必丢失标题或从docx中提取标题并添加到YAML标题中,然后将其连接到转换后的markdown文件中。 / p>
示例代码,其中从docx转换为markdown时标题丢失:
<ul class="nav1-1">
<li ><a href="">1.1.</a></li>
<li ><a href="">1.2</a>
<ul class="nav1-2">
<li><a href="">1.2.1</a></li>
<li><a href="">1.2.2</a></li>
</ul>
</li>
<li><a href="">1.3</a>
<ul class="nav1-2">
<li><a href="">1.3.1</a></li>
<li><a href="">1.3.2</a></li>
</ul>
<li><a href="">1.4</a></li>
</ul>
答案 0 :(得分:1)
从 docx 转换为 Markdown(或其他标记格式,如 rst)时,您需要包含 http://www.reddit.com/r/somepage.php?query=example
或 -s
选项。
来自 pandoc documentation:
<块引用>-s, --standalone
使用适当的页眉和页脚生成输出(例如独立的 HTML、LaTeX、TEI 或 RTF 文件,而不是片段)。此选项是为 pdf、epub、epub3、fb2、docx 和 odt 输出自动设置的。对于本机输出,此选项会导致包含元数据;否则,元数据将被抑制。
如果没有 --standalone
,此数据将被抑制。