标签: java python http pdf pdfbox
我有两个微服务:一个用于摘录,一个用于提供PDF等文件。我必须从其他微服务获取PDF文件,但必须通过网络传输整个文件的速度很慢。我试图找到一种方法只传输必要的字节数,以便提取PDF的x页面。
为此,我可以使用HTTP' Range'标头指定我需要的字节。但是,我无法找到一个PDF库(可以用任何编程语言编写),它允许我在不解析整个文档的情况下提取x到y页面(我试过PDFBox)。我正在寻找一个图书馆,但欢迎提出意见。
感谢。