Question

Google云视觉api非常强大，现在它们支持pdf格式，但是文档让我感到困惑，有人可以指导菜鸟如何使用视觉api设置和处理pdf文件。

有点像入门教程

ref：https://cloud.google.com/vision/docs/pdf#vision-web-detection-gcs-protocol

混淆之处在于如何传递命令参数，发送示例文件并以csv或json格式检索结果

我应该在谷歌云上使用Windows命令行还是cloudshell

其他服务有很好的入门参考，如果您查看此https://cloud.google.com/vision/docs/ocr#vision-detect-labels-gcloud，它们显然给出了可在不同环境中使用的命令

Answer 1

您可以使用以下curl命令作为基础，并在您的Google Cloud Shell会话中运行它：

curl -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) --header "Content-Type: application/json"   --request POST   --data '{ "requests":[  {"inputConfig": { "gcsSource": {  "uri": "gs://<Your Bucket>/<Your PDF FIle>"},"mimeType":"application/pdf"},"features": [{"type":"DOCUMENT_TEXT_DETECTION"}],"outputConfig": {"gcsDestination":{"uri": "gs://<Your destination bucket/"},"batchSize": 2}}]}' https://vision.googleapis.com/v1/files:asyncBatchAnnotate

然后，您将获得一个操作对象作为响应，例如："name": "operations/<This is your operation ID>"。

之后，您将通过GET请求获得结果，例如：

curl --request GET https://vision.googleapis.com/v1/operations/<The Operation ID>?key=<Your API Key>

我想使用Google Cloud的PDF / TIFF文档文本检测服务

1 个答案: