Formrecognizer预览:训练模型错误有效载荷太大

时间:2019-05-27 13:04:25

标签: machine-learning microsoft-cognitive form-recognizer

我正在尝试使用azure提供的测试控制台(西欧)在formrecognizer预览中训练模型。但是我收到一个错误代码413 Payload Too Large。错误消息是:无法处理数据集。数据集的大小超出了大小限制(4.00MB)。

我提供了一个指向blob容器的SAS-Storage-Url。这个Blob容器包含5个png文件。每个文件的大小在2.7到3.1 MB之间,内容类型为application / png。

从文档中我知道文件大小必须小于4 Mb。 整个数据集的大小(所有Trainig文件的总和)是否限制为4 MB?

2 个答案:

答案 0 :(得分:0)

Form Recognizer v1支持的训练集总数必须小于4兆字节(MB)。 Form Recognizer v1 API是同步API,并且对处理时间有时间限制,因此也有限制。请尝试减少火车文件并重试。

答案 1 :(得分:0)

更多详细信息:尝试使用V2 API或更高版本。

除了缩小培训文档之外,不可能“解决”此问题。以下是手动缩小而不是使用代码缩小它们的过程:

  • PDFEscape(具有免费试用版,出色的工具)
    • 导出页面中的所有图像
  • Irfanview-批处理操作,按百分比调整图像大小,保存为PDF
  • PDFEscape选择单个页面图像的所有PDF版本,在Windows资源管理器中右键单击,然后单击PDFEscape-merge。如有必要,请重新排序,然后保存新的PDF