仅仅出于个人兴趣,我从研究中看到,开始自己的OCR并不容易。但是,我想听听如何实现挑战的想法,不仅要识别字符,还要在格式化的字符串中返回结果。 例如,我有一张桌子的图像(想象它是一个图像,其中“|”和“_”是直线绘制的):
| Number,AnotherNumber | Some Text |
| 1,4 | Blah |
使用静音OCR后,我得到的结果为“| Number,AnotherNumber | SomeText | \ n | 1,4 | Blah |” 关于如何实现这一点的任何想法,以及我可以利用哪些可用的工具/库?我也想用Visual Studio 2010在C#中编写它。理想情况下,使用PDF但不同的图像格式也可以。我已经看过一些,但它们似乎是不兼容的,因为它们使用的是C ++或C. 谢谢。 阿丽娜。
答案 0 :(得分:0)