Google Cloud Vision API PDF文本提取

时间:2018-08-30 08:56:13

标签: ocr google-cloud-vision google-vision pdftotext

我正在尝试使用Google文档https://cloud.google.com/vision/docs/pdf中提供的python代码从pdf(将图像转换为pdf)中提取文本。 我已经创建了服务帐户密钥并将其用于docs中提到的身份验证,并且在我的PC中使用了Google SDK。代码因以下错误而超时:

File "C:\*****\pdf_code.py", line 39, in async_detect_document
operation.result(timeout=180)   File "C:\Python27\lib\site-packages\google\api_core\future\polling.py", line 120, in result
raise self._exception google.api_core.exceptions.GoogleAPICallError: None Error writing final output to: gs://******/output-1-to-1.json

任何帮助将不胜感激。

2 个答案:

答案 0 :(得分:1)

我遇到了类似的错误,我正在使用服务帐户访问Cloud视觉api并在本地使用服务帐户密钥

我通过授予相同的服务帐户在存储桶上写入的权限解决了上述错误->

  • 导航到console.cloud.google.com
  • 存储->浏览器->导航到您要在其中存储输出文件的存储桶
  • 选择权限标签->单击“添加成员”按钮
  • 在“新成员”文本框中
  • 提及您的服务帐户-类似于 “ xyz-vision-api@your_project_name.iam.gserviceaccount.com”
  • 选择存储管理员角色
  • 保存

您的错误应得到解决

答案 1 :(得分:0)

其内容为:Error writing final output to: gs://******/output-1-to-1.json

...您可能必须在本地安装gcloudgsutil;还要检查存储区ACL

gcloud未登录或gsutil不可用时,这不会写入存储桶。