在将HTML页面转换为PDF时修复PDF辅助功能问题(注释缺少替代说明)

时间:2018-05-24 19:28:39

标签: html pdf itext

目前,我正在开发一个程序,使用iText库将html页面转换为PDF格式。

我使用的Checker是PAC3 - > PDF辅助功能检查器3,由以下链接(https://section508.gov/blog/check-pdf)描述。

其中一个问题是“注释缺少替代描述” 以下链接的摘录解释了它:

注释缺少替代描述当链接不够清晰时,通常会发生这种情况。要修复此错误,请在链接标记中添加替代文本。要添加替代文本,请执行以下操作;

  • 在标记树中,选择链接的标记,然后选择“属性” 从选项菜单中。
  • 在“Touchup属性”对话框中,选择 标签选项卡。
  • 键入链接的替代文字,然后点击关闭

我一直在尝试使用iText来解决这个问题,但谷歌搜索,查看源代码并阅读文档并没有帮助。

是否有人建议如何编写HTML或使用itext问题来摆脱“注释缺少替代描述”

感谢您的帮助

1 个答案:

答案 0 :(得分:4)

您没有指定是使用旧代码(XMLWorkerHTMLWorker)还是使用新的iText代码(pdfHTML)。

这当然会影响建议的解决方案。

在我的回答中,我将假设您正在使用pdfHTML

有几种选择:

  • 使用像JSoup
  • 这样的库编辑传入的HTML
  • 将传入的HTML转换为iText IElement对象,然后编辑这些对象,并根据需要设置属性
  • 编写自己的自定义TagWorker来处理特定标记的所有实例,并编写自定义逻辑来处理缺少的注释。

可以在此处找到自定义标签工作者的示例: https://developers.itextpdf.com/content/itext-7-examples/converting-html-pdf/pdfhtml-custom-tagworker-example