Question

我想使用Google Cloud Vision检测PDF和TIFF文件中的文本，但是从它的外观来看，只有先将文件存储到Google Cloud Storage中才能做到。无需将其存储在云中也可以做到吗？

Answer 1

当前，您需要将内容存储在Google Cloud Storage Bucket中。但是，有一个feature request可以读取PDF文件，而不必将其存储在存储桶中。我建议starring这个问题，并发表评论以表明这可以帮助您解决当前的情况。

Answer 2

如果您有图像（尚未尝试过PDF，可能需要覆盖图像），则可以将其转换为base 64并将其发送。.

一些代码段：

//主要缩写-----

Foreach (DataGridViewRow row in dataGridView1.Rows)
{
    if (row.Columns["Id"].Value.ToString().Equals(txtvalue.Text))
    {
        row.Selected = true;
        break;
    }
}

// -----------------------------------------

var cloudVisionUrl = $"{annotationTextApiUrl}{annotationTextApiKey}";

            var imageBase64 = DoYourOwnImageToBase64(path);

            var client = new HttpClient();

            var requests = new ApiRequest { Requests = new List<Request> { new Request { Image = new Image {Content = imageBase64}, Features = new List<Feature> {new Feature {Type = "TEXT_DETECTION"}} } } };

            var httpResponse = await client.PostAsJsonAsync(cloudVisionUrl, requests);

Answer 3

现在是possible。只需将文件转换为base64并将其放入inputConfig的内容中即可。支持的格式为PDF，gif和tiff。

使用Google Cloud Vision检测PDF / TIFF文件中的文本

3 个答案: