应用错误收集

从PDF中提取字符串大于某个值的字符串

时间：2017-06-23 11:30:12

标签： pdf extract

我需要消化一些格式错误的PDF文档。它没有索引，这使得导航文件非常困难。

如何从PDF中提取所有字符串，其字体大小大于某个值，例如20px和页码，总是在同一个位置？

有了这些信息，我可以自己创建索引。

0 个答案:

没有答案