我有一个项目使用Google Vision API DOCUMENT_TEXT_DETECTION来从文档图片中提取文字。
通常,API在识别单个数字方面存在问题,如下图所示:
我认为问题可能与某些噪声消除算法有关,它将孤立的单个数字识别为噪声。有没有办法在这些情况下改善视力反应? (例如管理噪声阈值或其他参数)
在其他时候,Vision会将数字与字母混淆:
但如果我指定为参数languageHints =' en'或者' mt'这些数字被ocr忽略。有没有办法强制识别数字或拉丁字符?
答案 0 :(得分:0)