AWS Textract复选框从C#中的pdf文档中检查了值

时间:2020-06-03 10:37:49

标签: c# amazon-web-services pdf checkbox aws-textract

我正在使用Amazon Textract从pdf文档(refer link)中提取文本,其工作正常。我需要从同一pdf文档中获取复选框的选中项。如何从pdf文档中获取复选框的选择请通过一些灯光

1 个答案:

答案 0 :(得分:0)

关于检测 选择元素 ,例如文档页面上的单选按钮和复选框,可以在表单数据和表格中检测到这些元素。有关相同内容,请参见以下文档:https://docs.aws.amazon.com/textract/latest/dg/how-it-works-selectables.html

如果选择元素的样式与上述文档中给出的样式不同,则从Textract返回的结果可能不包括这些元素,或者可能不准确。

进一步,查看从Textract API返回的JSON数据,需要从返回的Blocks中提取KEY_VALUE_SET BlockType 对象获取here中概述的从文档中提取的所有复选框值。