如何以编程方式从静态URL不可用的网站下载文件或如何形成静态URL

时间:2017-11-24 08:58:24

标签: javascript java web-scraping download

我想使用Java从网站下载文件。网站网址为

https://340bopais.hrsa.gov

点击网址后,您会看到一个菜单' Reports / Files'。点击它。现在,URL将变为:

https://340bopais.hrsa.gov/reports

然后点击'每日报告'。然后点击“涵盖实体每日报告”#39;文件将下载到您的计算机上。

我想使用Java程序下载此文件。我检查了按钮“涵盖实体每日报告”'并找到了以下HTML,其中调用了Javascript脚本。如何使用Java程序单击此按钮?

> <a id="ContentPlaceHolder1_lnkCEDailyReport" class="btn btn-primary
> btn-lg btn-block   " title=" Click here to download the Covered Entity
> Daily Report"
> href="javascript:__doPostBack('ctl00$ContentPlaceHolder1$lnkCEDailyReport','')">Covered Entity Daily Report</a>

1 个答案:

答案 0 :(得分:1)

以下是没有代码的人的答案:

  • 使用以下网址:https://340bopais.hrsa.gov/reports
  • 使用“WebClient”
  • 连接到此网址
  • 使用'HtmlPage'获取页面
  • 等到加载JavaScript文件。
  • 下载执行它并将结果下载到给定路径。

Mabe this already asked example代码可以帮助您。