我想通过阅读它显示的文本来连接应用程序。
我在某些应用程序中取得了成功,当Windows没有通过手动输入短语进行任何字体平滑,在所有Windows字体中呈现它,并找到匹配 - 从那里我可以将每个字母图像映射到一个字母通过生成字体中的所有字母。
如果通过Windows或应用程序进行任何字体平滑,则无法使用此功能。在OCRing计算机生成的文本中,最先进的是什么?看起来它应该比破坏CAPTCHAs或OCRing扫描文本更容易。我在哪里可以找到有关此的资源?到目前为止,我只发现有关CAPTCHA破坏或OCR扫描文本的文章。
我更喜欢可以从Python轻松访问的解决方案,但如果在其他lang中有一个很好的解决方案,我会完成接口工作。
答案 0 :(得分:1)
我不确定你的意思,但我认为只需用OCR程序阅读文本就可以了。
Tesseract对于扫描文档来说非常准确,因此特定字体对于它来说是轻而易举的。这是我的Python OCR解决方案:Python OCR Module in Linux?。
但是你可以生成每个角色作为图像并在图像上找到位置。它(可能)有效,但我不知道平滑会有多精确。