使用AutoML自然语言现在似乎表现为以下方式:
1)当输入PDF有效负载进行在线预测时,似乎只处理了5页PDF(PDF <2MB)。我尝试使用8页和11页的PDF,每次仅处理5页。
https://cloud.google.com/automl/docs/reference/rest/v1/projects.locations.models/predict-旁注:文档中可能有错字(20MB应该是2MB):
AutoML自然语言实体提取-最多10,000个字符的TextSnippet,UTF-8 NFC编码或.PDF,.TIF或.TIFF格式的文档,大小最大为20MB。
2)response.preprocessedInput.document.layout
变量似乎不遵循说明(https://cloud.google.com/automl/docs/reference/rpc/google.cloud.automl.v1#google.cloud.automl.v1.Document)的文档:
描述文档的布局。按[page_number] []排序。
相反,layout
变量似乎只是令牌的一长串。
有没有想到我是否在某个地方搞砸了?