标签: image
我有一个从硬拷贝中扫描的pdf文件。因此,pdf文件具有硬拷贝的图像。现在,当我尝试将pdf转换为单词时,我没有得到一个可编辑的文档,而是我得到一个图像坐在word文档上。有什么方法可以制作出可编辑的文档吗?任何软件程序或哪些东西可以帮助我做到这一点?
答案 0 :(得分:3)
它被称为光学字符识别OCR
有很多软件包可以做到这一点 - 在程序中尝试http://code.google.com/p/tesseract-ocr/