使用OCR识别“文本大小”和“文本字体”

时间:2017-01-05 12:16:42

标签: android image-processing ocr

我必须识别来自Image的文本,这是可能的,因为有大量的OCR库,但现在我必须找到文本大小和字体类型。 我已经搜索了很多但没有得到帮助,这是可能的,商店里有一个应用程序“WhatTheFont”,它找到了最匹配的字体类型。怎么做?

1 个答案:

答案 0 :(得分:0)

我直接从评论(http://stackoverflow.com/questions/4601291/ocr-combined-with-font-recognition?rq=1)中的链接中复制了此答案,因为该问题和答案已被删除,仅在Google缓存中找到。我对此感兴趣,所以不想依赖断开的链接:)

由安德鲁·卡什(https://stackoverflow.com/users/433635/andrew-cash)致谢

这是普通的OCR引擎通常执行的操作。看ABBYY FineReader,Omnipage,Cuneiform,Google Tessetact,Expervision等...

这并不像看起来许多商用OCR引擎那样容易 犯了愚蠢的错误,大多数引擎都花了多年的时间开发。

查找段落边界框的问题是OCR的一部分 处理。对于您的情况,段落分区非常简单,但请考虑 报纸或杂志的一页,工作就变得困难得多。

保存背景的问题同样困难。简单 单色背景很容易删除,但添加一些 稍微复杂一点,很快就会变得困难。

将所有三个问题合并在同一张图像中,甚至得到均匀 更加困难。添加一些线和框,灰度底纹, 半色调,旋转字体,淡入淡出和其他特殊效果以及OCR 几乎变得不可能。许多OCR引擎的准确度为100% 具有清晰定义的文本的简单页面,但是当您开始添加更多页面时 文档的复杂性然后阅读率开始下降 很快。一些OCR引擎要比其他引擎好得多。