在不使用&pdffotext'的情况下在PDF中查找文本命令行工具,但它的API代替

时间:2015-04-15 11:39:11

标签: c++ pdf pdftotext

我想在PDF文件中找到文本及其边界框。

似乎效果最好的工具是pdftotext(基于XPDF)。

但是我还没弄清楚如果没有命令行就可以使用这个工具,也没找到非命令行API。我希望能够在不使用系统调用的情况下在C ++程序中使用它。

有谁知道怎么做?

1 个答案:

答案 0 :(得分:1)

pdftotext(XPDF)有一个基于 Poppler 库的(分叉)兄弟,它是10年前从XPDF代码库派生而来的。

Poppler的源代码存储库在这里:

在那里你应该很容易找到如何使用Poppler的C ++ API。