我试图弄清楚如何使用.NET语言以编程方式从图像中获取文本,最好是C#。
我知道有几个免费软件可以从图像中提取文本,我有MS OneNote。 OneNote似乎对我提取文本很好,但我不知道如何以编程方式进行,只使用用户界面。
我想从那里做的其余处理我可以自己解决,但我需要代码来获取像OneNote这样的OCR程序从文件夹位置打开PDF,在PDF中读取扫描图像,将其转换为文本,并将文本保存到数组中以供进一步处理。
答案 0 :(得分:4)
以下是C#中使用Microsoft OCR的一些优秀的源代码(完整的OCR应用程序):
https://github.com/A9T9/Free-OCR-Software
Windows应用商店的免费开源OCR应用程序 - Microsoft OCR库的现代GUI前端。该应用程序还包括对阅读和OCR的PDF文件的支持。
另一种选择是使用像Google Cloud Vision这样的online ocr service。