问候Overflowers,
我需要一种算法来扫描扫描文档图像中的单词周围的矩形。 无论如何,该算法不需要100%准确。 但是,在工作期间最好需要最少的人为干预。 手上没有对扫描文档的假设(未知字体和语言,可能包括表格和图形)
有关此问题的任何现成解决方案或资源吗?
此致
答案 0 :(得分:0)
大多数OCR引擎都提供此类信息。但是如果您不想使用引擎,OpenCV可以用于此,但它需要建模和调整。
OpenCV中的OCR http://blog.damiles.com/?p=93
这是一大步。简而言之,这是一个难以解决的问题,如果你想自己做,那么它需要很长时间才能让它运转起来。您最有可能考虑使用第三方OCR包。像Nuance。我已经使用它并且可以验证它是否具有这种类型的信息以及更多信息。
http://www.nuance.com/for-individuals/by-product/omnipage/index.htm