我正在寻找一些方法来阅读.pdf
文件而我无法从中获取任何内容,我可能需要一个库,但我找到的所有选项都非常令人困惑且难以处理。
我想知道哪种方式是我完成此任务的最佳方式,即搜索.pdf
并获取其摘要部分中的内容。 (这是文字)
答案 0 :(得分:2)
最简单,最便宜的是使用一个很受欢迎且其他程序员都知道的开源库。
在尝试从头开始编写自己的PDF阅读器之前,请先看看这些:
解析:
PoDoFo库是一个免费的,可移植的C ++库,包括 用于解析PDF文件并将其内容修改为内存的类。该 更改可以轻松写回磁盘。解析器也可以 用于从PDF文件中提取信息(例如解析器 可以在PDF查看器中使用)。除了解析PoDoFo还包括 非常简单的类来创建自己的PDF文件。所有课程都是 记录下来很容易开始编写自己的应用程序 PoDoFo。