使用Google Cloud Vision检测PDF / TIFF文件中的文本

时间:2018-09-26 07:16:46

标签: c# google-cloud-vision

我想使用Google Cloud Vision检测PDF和TIFF文件中的文本,但是从它的外观来看,只有先将文件存储到Google Cloud Storage中才能做到。无需将其存储在云中也可以做到吗?

3 个答案:

答案 0 :(得分:2)

当前,您需要将内容存储在Google Cloud Storage Bucket中。但是,有一个feature request可以读取PDF文件,而不必将其存储在存储桶中。我建议starring这个问题,并发表评论以表明这可以帮助您解决当前的情况。

答案 1 :(得分:0)

如果您有图像(尚未尝试过PDF,可能需要覆盖图像),则可以将其转换为base 64并将其发送。.

一些代码段:

//主要缩写-----

Foreach (DataGridViewRow row in dataGridView1.Rows)
{
    if (row.Columns["Id"].Value.ToString().Equals(txtvalue.Text))
    {
        row.Selected = true;
        break;
    }
}

// -----------------------------------------

var cloudVisionUrl = $"{annotationTextApiUrl}{annotationTextApiKey}";

            var imageBase64 = DoYourOwnImageToBase64(path);

            var client = new HttpClient();

            var requests = new ApiRequest { Requests = new List<Request> { new Request { Image = new Image {Content = imageBase64}, Features = new List<Feature> {new Feature {Type = "TEXT_DETECTION"}} } } };

            var httpResponse = await client.PostAsJsonAsync(cloudVisionUrl, requests);

答案 2 :(得分:0)

现在是possible。只需将文件转换为base64并将其放入inputConfig的内容中即可。支持的格式为PDF,gif和tiff。