服务器上的PDFQuery +文件

时间:2014-11-29 11:31:21

标签: python pdf pypdf pdfminer

我正在尝试搜索文字字符串,说“可以”,位于“https://developer.apple.com/library/ios/documentation/ides/conceptual/AppDistributionGuide/AppDistributionGuide.pdf”上的文件中

为此我正在使用PDFQuery。最初我在我的机器上下载了pdf并完成了我的代码。它工作得很完美。但是,当我尝试在文件位置输入服务器URL时,它显示错误。我知道PDFQuery库是为在本地机器上工作而开发的。

有什么方法可以找出问题并解决我的问题。这是我的课程项目的一部分,我应该开发的pdf搜索模块将部署在IBM Bluemix上并从那里运行。在我的项目中只有这部分待定。任何帮助表示赞赏。

提前谢谢。

1 个答案:

答案 0 :(得分:0)

将问题分成两位。

i)下载文件。   ii)处理文件。

以下是步骤i)的一些帮助 How do I download a file over HTTP using Python?