标签: vb.net pdf ocr
我有一个扫描的PDF文件,我需要一个VB.net源代码,将扫描的PDF转换为文本格式。
答案 0 :(得分:2)
扫描文件很可能没有文本而是图像,因此您必须查看OCR工具才能获取文本。
有几个OCR库,如
Open source OCR
https://stackoverflow.com/questions/1085/free-ocr-library
答案 1 :(得分:0)
看看http://snipt.org/lOgh/ - 它在C#中(应该相对容易在VB.NET中重写),并使用可通过API访问的托管OCR解决方案