我想在PDF文件中找到文本及其边界框。
似乎效果最好的工具是pdftotext
(基于XPDF)。
但是我还没弄清楚如果没有命令行就可以使用这个工具,也没找到非命令行API。我希望能够在不使用系统调用的情况下在C ++程序中使用它。
有谁知道怎么做?
答案 0 :(得分:1)
pdftotext
(XPDF)有一个基于 Poppler 库的(分叉)兄弟,它是10年前从XPDF代码库派生而来的。
Poppler的源代码存储库在这里:
在那里你应该很容易找到如何使用Poppler的C ++ API。