我想使用Google Cloud的PDF / TIFF文档文本检测服务

时间:2018-10-02 18:13:49

标签: google-cloud-vision

Google云视觉api非常强大,现在它们支持pdf格式,但是文档让我感到困惑,有人可以指导菜鸟如何使用视觉api设置和处理pdf文件。

有点像入门教程

ref:https://cloud.google.com/vision/docs/pdf#vision-web-detection-gcs-protocol

混淆之处在于如何传递命令参数,发送示例文件并以csv或json格式检索结果

我应该在谷歌云上使用Windows命令行还是cloudshell

其他服务有很好的入门参考,如果您查看此https://cloud.google.com/vision/docs/ocr#vision-detect-labels-gcloud,它们显然给出了可在不同环境中使用的命令

1 个答案:

答案 0 :(得分:1)

您可以使用以下curl命令作为基础,并在您的Google Cloud Shell会话中运行它:

curl -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) --header "Content-Type: application/json"   --request POST   --data '{ "requests":[  {"inputConfig": { "gcsSource": {  "uri": "gs://<Your Bucket>/<Your PDF FIle>"},"mimeType":"application/pdf"},"features": [{"type":"DOCUMENT_TEXT_DETECTION"}],"outputConfig": {"gcsDestination":{"uri": "gs://<Your destination bucket/"},"batchSize": 2}}]}' https://vision.googleapis.com/v1/files:asyncBatchAnnotate

然后,您将获得一个操作对象作为响应,例如:"name": "operations/<This is your operation ID>"

之后,您将通过GET请求获得结果,例如:

curl --request GET https://vision.googleapis.com/v1/operations/<The Operation ID>?key=<Your API Key>