Question

我们已经使用一段时间的异步批处理作业来处理PDF文件，而无需先将其转换为图像。到昨晚为止，一切正常。创建工作后，工作似乎永远不会完成。我们的工作卡住了11个小时，在取消工作后，我尝试了其他一些PDF作业，但全部卡住了。

我们将文件上传到GCP存储，使用Feature_DOCUMENT_TEXT_DETECTION启动AsyncBatchAnnotateFilesRequest，然后使用operation.Wait（）使其每隔45秒检查一次作业状态，以检查是否完成。我们使用Go库执行此操作。

还有其他人看到此问题或知道是什么原因造成的吗？

Answer 1

我从昨晚开始遇到这种情况，猜测Google方面发生了一些变化。对我有用的是确保要输出的目录/文件首先不存在。

Iterable<Blob> blobs = storage.list(outputBucketName,
    BlobListOption.prefix(outputFolderName.replaceAll("^[^/]*/", ""))).iterateAll();
for (Blob blob : blobs) {
    blob.delete(Blob.BlobSourceOption.generationMatch());
}

编辑：实际上，也许这是完全不相关的，谷歌没有提供详细信息，但表示现在不应再被卡住了：

https://groups.google.com/forum/#!topic/cloud-vision-discuss/p0PbNQ2KMGg

异步批处理作业卡住了吗？

1 个答案: