如何使用pandoc为docx转换设置图片的替代文字

时间:2016-03-03 12:48:28

标签: pdf accessibility docx pandoc

导出到docx时,pandoc会将图片标签设置为其标题。有没有办法设置与标题不同的alt-text?

上下文

我们使用Pandoc生成我们想要转换为PDF的Markdown文档。

我安装了BasicTeX并使用以下markdown进行了一些测试:

# This is the title

This is a paragraph.

![This is an image](image.jpg)

This is another paragraph.

你可以download the file here

使用Pandoc转换此代码会产生this PDF file

当我在无障碍咨询公司工作时,我首先使用PDF Accessibility Checker 2检查了PDF文件,结果是毁灭性的:

PAC2 results

More results

所以我尝试了exporting to Microsoft Docx的解决方法(使用正确的文档样式时可以高度访问)。

从那里我使用AccessPDF导出为PDF,这里the resulting PDF file

使用PAC2检查时,结果如下:

Results

好多了,但是图片缺少替代文字!因此,替代文字似乎用作caption的{​​{1}}(与在HTML中完成的方式相同),而在HTML导出中figure - 标记设置正确,在Docx中,替代文本被删除。

我们如何解决这个问题?事实上,当有标题时,图片本身应该alt文本相同 - 再次显示文字,这意味着:它导出为HTML的方式并不完美。那么:我们在降价方面有多少控制权来明确指定altcaption内容?

1 个答案:

答案 0 :(得分:3)

来自pandoc readme

  

段落中自身出现的图像将呈现为带有标题的图形。 (在LaTeX中,将使用数字环境;在HTML中,图像将放置在带有类图的div中,以及带有类标题的ap中的标题。)图像的alt文本将用作标题。

![This is the caption](/url/of/image.png)

更新:我看到你创建了issue about this。的确,出于某种原因,docx writer currently uses the title text instead of the alt text。不确定这是否是预期的行为。同时,您可以使用标题文本,如:

![alt text](foo.jpg "title text")

关于可访问性:pandoc默认使用LaTeX(您可以选择几个引擎)来生成PDF,但实际上不幸的是LaTeX isn't known to generate very accessible PDFs。也许ConTeXt更好?

$ pandoc -t context -o mydoc.tex input.md
$ context mydoc.tex