iText7表摘要

时间:2018-08-29 04:15:22

标签: c# itext7

我使用iText7和pdfHTML附件将表添加到PDF。要设置表的可访问性,我想设置表的摘要。我在下面找到了同样的问题。但是对此还没有明确的答案。如何设置表格摘要。请指教。

iText7 508 Table Summary

2 个答案:

答案 0 :(得分:1)

我刚刚尝试过:

PdfDictionary attr = new PdfDictionary();
attr.put(new PdfName("Summary"), new PdfString("Info about the table"));
table.getAccessibilityProperties().addAttributes(new PdfStructureAttributes(attr));

这似乎可以解决问题。现在,您需要调整标签工作程序以确保遇到table标签时执行此代码。

更新1:

我已获取以下HTML文件:

<body>
<table summary="some keys and values">
<thead>
<tr><th scope="col">KEY</th><th scope="col">VALUE</th></tr>
</thead>
<tbody>
<tr><td>Color</td><td>Blue</td></tr>
<tr><td>Shape</td><td>Rectangle</td></tr>
<tr><td>Description</td><td>Blue rectangle</td></tr>
</tbody>
</table>
</body>

我已将其转换为可访问的PDF文档,如下所示:

public void createPdf(String src, String dest) throws IOException {
    PdfWriter writer = new PdfWriter(dest,
        new WriterProperties().addUAXmpMetadata());
    PdfDocument pdf = new PdfDocument(writer);
    pdf.setTagged();
    pdf.getCatalog().setLang(new PdfString("en-US"));
    pdf.getCatalog().setViewerPreferences(
            new PdfViewerPreferences().setDisplayDocTitle(true));
    PdfDocumentInfo info = pdf.getDocumentInfo();
    info.setTitle("iText7 accessible tables");
    ConverterProperties properties = new ConverterProperties();
    FontProvider fontProvider = new DefaultFontProvider(false, true, false);
    properties.setFontProvider(fontProvider);
    HtmlConverter.convertToPdf(new FileInputStream(src), pdf, properties);
}

用PAC3检查结果时,得到以下结果:

enter image description here

到目前为止,从技术的角度来看,PDF被认为是可访问的PDF / UA文件。

然后我进行了“人工”检查:表格摘要是否存在?不幸的是,事实并非如此,因此我调查了pdfHTML附加组件的代码,但没有找到对summary标记的table属性的任何引用。我认为这是在实施pdfHTML时忘记的。

在第一个实例中,我将编写一个自定义标签工作程序,负责添加摘要。完成此操作后,我将要求iText Group实现summary属性,以便将其添加到下一个版本中。

更新2:

我修改了这样的示例:

public void createPdf(String src, String dest) throws IOException {
    PdfWriter writer = new PdfWriter(dest,
        new WriterProperties().addUAXmpMetadata());
    PdfDocument pdf = new PdfDocument(writer);
    pdf.setTagged();
    pdf.getCatalog().setLang(new PdfString("en-US"));
    pdf.getCatalog().setViewerPreferences(
            new PdfViewerPreferences().setDisplayDocTitle(true));
    PdfDocumentInfo info = pdf.getDocumentInfo();
    info.setTitle("iText7 accessible tables");
    ConverterProperties properties = new ConverterProperties();
    properties.setTagWorkerFactory(new AdaptedTagWorkerFactory());
    FontProvider fontProvider = new DefaultFontProvider(false, true, false);
    properties.setFontProvider(fontProvider);
    HtmlConverter.convertToPdf(new FileInputStream(src), pdf, properties);
}

class AdaptedTagWorkerFactory extends DefaultTagWorkerFactory {
    @Override
    public ITagWorker getCustomTagWorker(IElementNode tag, ProcessorContext context) {
        if(tag.name().equals("table")){
            return new TableWithSummaryTagWorker(tag, context);
        }
        return null;
     }
}

class TableWithSummaryTagWorker extends TableTagWorker {

    private String summary = null;

    public TableWithSummaryTagWorker(IElementNode element, ProcessorContext context) {
        super(element, context);
    }

    @Override
    public void processEnd(IElementNode element, ProcessorContext context) {
        super.processEnd(element, context);
        summary = element.getAttribute("summary");
        if (summary != null) {
            Table table = (Table) super.getElementResult();
            PdfDictionary attr = new PdfDictionary();
            attr.put(new PdfName("Summary"), new PdfString(summary));
            table.getAccessibilityProperties().addAttributes(new PdfStructureAttributes(attr));
        }
    }
}

我通过PAC3运行了该程序,它仍然可以作为PDF / UA进行验证,但是在任何地方都没有提及表格摘要。当我查看PDF时,现在可以看到摘要:

enter image description here

我现在将与iText Group共享此信息,并请他们检查我的解决方案是否正确(如果这不能解决您的问题,请添加评论)。如果可以,那么很有可能将从iText 7.1.4开始实施。

更新3:

我已经根据OP提供的答案修改了我的代码。 OP的代码中有一个错误。在该代码中,/Summary被添加为PDF名称,而它应该是PDF字符串。

public void createPdf(String src, String dest) throws IOException {
    PdfWriter writer = new PdfWriter(dest,
        new WriterProperties().addUAXmpMetadata());
    PdfDocument pdf = new PdfDocument(writer);
    pdf.setTagged();
    pdf.getCatalog().setLang(new PdfString("en-US"));
    pdf.getCatalog().setViewerPreferences(
            new PdfViewerPreferences().setDisplayDocTitle(true));
    PdfDocumentInfo info = pdf.getDocumentInfo();
    info.setTitle("iText7 accessibility example");
    ConverterProperties properties = new ConverterProperties();
    properties.setTagWorkerFactory(new AdaptedTagWorkerFactory());
    FontProvider fontProvider = new DefaultFontProvider(false, true, false);
    properties.setFontProvider(fontProvider);
    HtmlConverter.convertToPdf(new FileInputStream(src), pdf, properties);
}

class AdaptedTagWorkerFactory extends DefaultTagWorkerFactory {
    @Override
    public ITagWorker getCustomTagWorker(IElementNode tag, ProcessorContext context) {
        if(tag.name().equals("table")){
            return new TableWithSummaryTagWorker(tag, context);
        }
        return null;
     }
}

class TableWithSummaryTagWorker extends TableTagWorker {

    private String summary = null;

    public TableWithSummaryTagWorker(IElementNode element, ProcessorContext context) {
        super(element, context);
    }

    @Override
    public void processEnd(IElementNode element, ProcessorContext context) {
        super.processEnd(element, context);
        IPropertyContainer elementResult = super.getElementResult();
        summary = element.getAttribute("summary");
        if (summary != null && elementResult instanceof IAccessibleElement) {
            AccessibilityProperties properties = ((IAccessibleElement)elementResult).getAccessibilityProperties();
            properties.addAttributes(new PdfStructureAttributes("Table").addTextAttribute("Summary", summary));
        }
    }
}

现在,当您检查结果时,您会得到以下报告:

enter image description here

如您所见,摘要测试通过。

答案 1 :(得分:1)

谢谢布鲁诺。我用的是C#。并且 ProcessEnd 方法应进行如下更改。

public override void ProcessEnd(IElementNode element, ProcessorContext context)
    {
    base.ProcessEnd(element, context);
    IPropertyContainer elementResult = base.GetElementResult();
    if (elementResult is IAccessibleElement)
    {
    string summary= element.GetAttribute("summary"); //This is the summary="tbl summary" in HTML
    AccessibilityProperties properties = ((IAccessibleElement)elementResult).GetAccessibilityProperties();
    properties.AddAttributes(new PdfStructureAttributes("Table").AddEnumAttribute("Summary", summary));
    }
    }

要查看表格标题,您必须使用Adobe Acrobat Professional打开pdf。右键单击表格,然后选择“编辑表格摘要”。标题将显示在这里。