我有一个像这样的html文件:
<!DOCTYPE html>
<html>
<head>
<style>
h1 {text-align:center;}
p {text-align:center;}
</style>
</head>
<body>
<h1>My heading</h1>
<p>Some poetry here.</p>
</body>
</html>
我想在pandoc中将其转换为docx。我尝试了通常的命令
pandoc -s test.html -o test.docx
文本正确呈现,但不是居中。我自动生成数百个htmls,因此手动修复不在预算范围内。基本上我需要让一些段落左对齐(默认)和一些居中,因为它们是诗歌。如何实现这一目标?
谢谢。
PS:我也可以使用markdown作为输入语言而不是Html。
答案 0 :(得分:2)
您需要自定义一个 docx 模板,并在将 HTML 转换为 docx 时应用该模板。在您的情况下,<h1>
在 Word 中转换为 Heading 1
,而 <p>
转换为 First Paragraph
。
步骤:
创建 docx 模板。
pandoc -o custom-reference.docx --print-default-data-file reference.docx
打开 custom-reference.docx
并修改样式。
Heading 1
First Paragraph
保存custom-reference.docx
转换。
pandoc input.html -o output.docx --reference-doc custom-reference.docx