标签: google-api ocr text-extraction google-cloud-vision vision
我一直在使用Google Vision API从数十万张图片中读取文字。一些图像是模因或稀疏标题或分散的涂鸦,而一些图像则靠近密集的文档。我在所有图像上都使用了图像文本阅读器和文档文本检测,并且在这两个服务中都使用了一些返回的文本表示形式。 如何确定哪个结果最好保留,哪个可以丢弃?
我本来希望在清理文本并保留较长的文本后测量令牌的长度,但是感觉太简单了,无法使用