从网络搜索Java获取标题和日期

时间:2014-05-23 12:58:10

标签: java html asp.net web-scraping

第一次在这里问一个问题,如果我犯了任何新手的错误,请耐心等待。

所以我有网站

  

https://www.privaworks.com/Profile/Login.aspx?protected_item=%2fModules%2fsearch.aspx%3f%26sk%3dPrivaWorks%26s%3d537e3c6ddf2b8c1dd4fd91ac%26sg%3deeaea0c2-1016-438f-81bc-c8c34c2888f4

有一个搜索部分。

我需要执行以下操作:

  1. 登录网站
  2. 点击HTML页面
  3. 点击下一个搜索项
  4. 重复最后两步直至完成
  5. 从每篇文章标题中获取标题和日期
  6. 将标题和日期导出为ex​​cel
  7. 目前我可以做的是获取登录页面的HTML,因为我无法弄清楚如何登录。展望未来我知道如何做除登录以外的所有事情并点击下一个搜索项目。

    任何人都可以帮我一把吗?我有点失落。

    提前致谢

    -Nick

0 个答案:

没有答案