标签: linux command-line ocr tesseract
我们正在使用tessereact从tiff扫描文档中提取文本,我们使用tesseract命令行选项启动它,但我们希望使用Tesseract V3.0将此tiff扫描文档转换为带有可搜索文本的PDF,以及我们需要使用命令行来获取它。
我们的系统是一个Ubuntu 12服务器,有关如何获得这个的任何想法?我们一直在搜索Tesseract V3.0数据表,但我们无法正确理解它。
你们中间有人有类似的东西吗?
提前多多感谢!!!
答案 0 :(得分:0)
您需要Tesseract v3.03才能生成可搜索的PDF。