android - 使用OCR识别“文本大小”和“文本字体”

我直接从评论（http://stackoverflow.com/questions/4601291/ocr-combined-with-font-recognition?rq=1）中的链接中复制了此答案，因为该问题和答案已被删除，仅在Google缓存中找到。我对此感兴趣，所以不想依赖断开的链接：）

由安德鲁·卡什（https://stackoverflow.com/users/433635/andrew-cash）致谢

这是普通的OCR引擎通常执行的操作。看ABBYY FineReader，Omnipage，Cuneiform，Google Tessetact，Expervision等...

这并不像看起来许多商用OCR引擎那样容易犯了愚蠢的错误，大多数引擎都花了多年的时间开发。

查找段落边界框的问题是OCR的一部分处理。对于您的情况，段落分区非常简单，但请考虑报纸或杂志的一页，工作就变得困难得多。

保存背景的问题同样困难。简单单色背景很容易删除，但添加一些稍微复杂一点，很快就会变得困难。

将所有三个问题合并在同一张图像中，甚至得到均匀更加困难。添加一些线和框，灰度底纹，半色调，旋转字体，淡入淡出和其他特殊效果以及OCR 几乎变得不可能。许多OCR引擎的准确度为100％具有清晰定义的文本的简单页面，但是当您开始添加更多页面时文档的复杂性然后阅读率开始下降很快。一些OCR引擎要比其他引擎好得多。

使用OCR识别“文本大小”和“文本字体”

1 个答案: