我们已经使用一段时间的异步批处理作业来处理PDF文件,而无需先将其转换为图像。到昨晚为止,一切正常。创建工作后,工作似乎永远不会完成。我们的工作卡住了11个小时,在取消工作后,我尝试了其他一些PDF作业,但全部卡住了。
我们将文件上传到GCP存储,使用Feature_DOCUMENT_TEXT_DETECTION启动AsyncBatchAnnotateFilesRequest,然后使用operation.Wait()使其每隔45秒检查一次作业状态,以检查是否完成。我们使用Go库执行此操作。
还有其他人看到此问题或知道是什么原因造成的吗?
答案 0 :(得分:1)
我从昨晚开始遇到这种情况,猜测Google方面发生了一些变化。对我有用的是确保要输出的目录/文件首先不存在。
Iterable<Blob> blobs = storage.list(outputBucketName,
BlobListOption.prefix(outputFolderName.replaceAll("^[^/]*/", ""))).iterateAll();
for (Blob blob : blobs) {
blob.delete(Blob.BlobSourceOption.generationMatch());
}
编辑:实际上,也许这是完全不相关的,谷歌没有提供详细信息,但表示现在不应再被卡住了:
https://groups.google.com/forum/#!topic/cloud-vision-discuss/p0PbNQ2KMGg