导出到docx时,pandoc
会将图片标签设置为其标题。有没有办法设置与标题不同的alt-text?
我们使用Pandoc生成我们想要转换为PDF的Markdown文档。
我安装了BasicTeX并使用以下markdown进行了一些测试:
# This is the title
This is a paragraph.
![This is an image](image.jpg)
This is another paragraph.
使用Pandoc转换此代码会产生this PDF file。
当我在无障碍咨询公司工作时,我首先使用PDF Accessibility Checker 2检查了PDF文件,结果是毁灭性的:
所以我尝试了exporting to Microsoft Docx的解决方法(使用正确的文档样式时可以高度访问)。
从那里我使用AccessPDF导出为PDF,这里the resulting PDF file
使用PAC2检查时,结果如下:
好多了,但是图片缺少替代文字!因此,替代文字似乎用作caption
的{{1}}(与在HTML中完成的方式相同),而在HTML导出中figure
- 标记设置正确,在Docx中,替代文本被删除。
我们如何解决这个问题?事实上,当有标题时,图片本身应该不与alt
文本相同 - 再次显示文字,这意味着:它导出为HTML的方式并不完美。那么:我们在降价方面有多少控制权来明确指定alt
和caption
内容?
答案 0 :(得分:3)
段落中自身出现的图像将呈现为带有标题的图形。 (在LaTeX中,将使用数字环境;在HTML中,图像将放置在带有类图的div中,以及带有类标题的ap中的标题。)图像的alt文本将用作标题。
![This is the caption](/url/of/image.png)
更新:我看到你创建了issue about this。的确,出于某种原因,docx writer currently uses the title text instead of the alt text。不确定这是否是预期的行为。同时,您可以使用标题文本,如:
![alt text](foo.jpg "title text")
关于可访问性:pandoc默认使用LaTeX(您可以选择几个引擎)来生成PDF,但实际上不幸的是LaTeX isn't known to generate very accessible PDFs。也许ConTeXt更好?
$ pandoc -t context -o mydoc.tex input.md
$ context mydoc.tex