需要帮助以从网址下载pdf文件。文件访问受到限制

时间:2019-06-25 19:31:05

标签: java

我正在尝试为我的测试自动化验证pdf信件的内容。为此,首先,我尝试将pdf文件下载到本地计算机并进行验证。但是我无法使用Java正确下载文件。 pdf是作为嵌入式文档存在于页面中的,该页面需要我首先登录。 html如下

<td colspan="2" style="vertical-align:top;" id="frameCell_24743998"><iframe id="viewFrame_24743998" src="https://wewewe.net/ewr/ww/desk/ViewQCWalzPDFAction.do?recordId=24743998&amp;we=we&amp;partitionId=16515&amp;Id=1561024580039s79n0a" height="550" width="800" style="width: 1254px;"></iframe><br></td>

所以我有了网址,并尝试使用

下载文件
FileUtils.copyURLToFile(new URL("https://wewewe.net/ewr/ww/desk/ViewQCWalzPDFAction.do?recordId=24743998&amp;we=we&amp;partitionId=16515&amp;Id=1561024580039s79n0a"), new File("C:\\workspace\\dfdf\\dfdffddf\\dd.pdf"));

但它显示

  

java.net.ConnectException:连接超时:   例外。

这是因为我尚未登录该应用程序并尝试下载。还有其他下载方式吗?

1 个答案:

答案 0 :(得分:1)

  

还有其他下载方式吗?

这在很大程度上取决于该网页的构建方式。

例如,可以在Java代码中使用 cookies ,有关如何执行此操作的说明,请参见here。含义:您可以启用Java代码以显示“授权”。

如果所有方法都不起作用(并且不能适应使服务器“以编程方式”访问此类文件),则可以使用自动化工具,例如进行“类似浏览器”的连接并下载。请参见there以获取指导。