我一直在寻找(不成功)打开PDF文件并从中获取书签的方法。我已经查看了大多数用于PDF的PHP库,但它们似乎专注于创建,而不是阅读。
此时,我对任何语言的解决方案感到满意,因此 不是PHP,但它会很好。
谢谢!
答案 0 :(得分:1)
如果所有其他方法都失败了,你可以尝试解析PDF来提取书签信息,虽然它确切地说在哪里以及它看起来像什么,但我并不是最模糊的。 PDF的核心只是一个Postscript文件,一旦你过滤掉所有二进制垃圾(字体定义,图像等等),你就会得到一堆纯文本的Potscript代码。
答案 1 :(得分:1)
您可能希望通过PDFLib查看“pCOS”库:
http://www.pdflib.com/products/pcos/
它能够从现有的PDF文件中提取各种信息,包括书签,并且可以作为PHP扩展使用。它不是免费软件,单个服务器的价格是245美元(195欧元)或更多,具体取决于操作系统。 (我与供应商没有任何关系)。