使用tesseract v3使用searcheable text命令行创建pdf文档

时间:2014-04-14 16:37:27

标签: linux command-line ocr tesseract

我们正在使用tessereact从tiff扫描文档中提取文本,我们使用tesseract命令行选项启动它,但我们希望使用Tesseract V3.0将此tiff扫描文档转换为带有可搜索文本的PDF,以及我们需要使用命令行来获取它。

我们的系统是一个Ubuntu 12服务器,有关如何获得这个的任何想法?我们一直在搜索Tesseract V3.0数据表,但我们无法正确理解它。

你们中间有人有类似的东西吗?

提前多多感谢!!!

1 个答案:

答案 0 :(得分:0)

您需要Tesseract v3.03才能生成可搜索的PDF。