我正在使用Amazon Textract从pdf文档(refer link)中提取文本,其工作正常。我需要从同一pdf文档中获取复选框的选中项。如何从pdf文档中获取复选框的选择请通过一些灯光
答案 0 :(得分:0)
关于检测 选择元素 ,例如文档页面上的单选按钮和复选框,可以在表单数据和表格中检测到这些元素。有关相同内容,请参见以下文档:https://docs.aws.amazon.com/textract/latest/dg/how-it-works-selectables.html
如果选择元素的样式与上述文档中给出的样式不同,则从Textract返回的结果可能不包括这些元素,或者可能不准确。
进一步,查看从Textract API返回的JSON数据,需要从返回的Blocks中提取KEY_VALUE_SET
BlockType 对象获取here中概述的从文档中提取的所有复选框值。