C#Custom OCR返回格式化字符串

时间:2012-07-14 08:44:44

标签: c# ocr

仅仅出于个人兴趣,我从研究中看到,开始自己的OCR并不容易。但是,我想听听如何实现挑战的想法,不仅要识别字符,还要在格式化的字符串中返回结果。 例如,我有一张桌子的图像(想象它是一个图像,其中“|”和“_”是直线绘制的):


| Number,AnotherNumber | Some Text |


| 1,4 | Blah |


使用静音OCR后,我得到的结果为“| Number,AnotherNumber | SomeText | \ n | 1,4 | Blah |” 关于如何实现这一点的任何想法,以及我可以利用哪些可用的工具/库?我也想用Visual Studio 2010在C#中编写它。理想情况下,使用PDF但不同的图像格式也可以。我已经看过一些,但它们似乎是不兼容的,因为它们使用的是C ++或C. 谢谢。 阿丽娜。

1 个答案:

答案 0 :(得分:0)

获得ocr库是非常困难的(当然,如果你没有喘气来支付它) 你可以尝试这个,它不是免费的,但如果你有办公室2007: http://www.codeproject.com/Articles/41709/How-To-Use-Office-2007-OCR-Using-C