从浏览器中打开的PDF中读取文本

时间:2012-04-18 15:50:25

标签: java pdf webdriver itext selenium-webdriver

有谁知道如何使用任何Java Framework或Javascript或Selenium2 Webdriver访问pdf文件的内容,pdf文件是否显示在浏览器中?

我需要验证在浏览器中打开的PDF文件的内容,PDF文件位于远程WebServer中,并且没有直接访问它。

任何建议都表示赞赏。

感谢。

2 个答案:

答案 0 :(得分:1)

“在浏览器中打开的PDF文件”是指Adobe Reader或类似的插件内部?我担心你无法通过Selenium控制那个。这里最好的方法是下载文件(也不是很简单,但可以使用Firefox或某些Java downloader完成)并使用ie http://pdfbox.apache.org/作为用户 kundan bora在磁盘上离线检查文件建议。

答案 1 :(得分:0)

您可以将Java库用于PDF Apache PDF-box -

http://pdfbox.apache.org/