用rvest

时间:2017-04-16 00:56:37

标签: r web-scraping rvest

我正在尝试使用rvest从此网页中提取csv文件:http://www.voterfind.com/athensoh/vtrreport.aspx

我想知道如何使用rvest连续提交两种表格。单击第一个表单上的“开始处理”按钮将转到带有“下载我的文件”按钮的第二个表单。

这是我到目前为止的代码,它产生了一个列表,而不是csv文件包含的数据集。

library(tidyverse)
library(rvest)`

`url <- "http://www.voterfind.com/athensoh/vtrreport.aspx"
pgsession <- html_session(url)
pgform <- html_form(pgsession)[[1]]
filled_form <- set_values(pgform, `grp_output` = TRUE)
athens <- submit_form(pgsession, filled_form)

以下是该列表的摘要。上面的submit_form引导我进入这个列表,它捕获了网页的一些元素,而不是csv文件中包含的所需数据集。这似乎表明我无法连续提交两个表单,从带有“开始处理”按钮的页面到带有“下载我的文件”按钮的页面。

List of 7
 $ handle  :List of 2
  ..$ handle:Class 'curl_handle' <externalptr> 
  ..$ url   : chr "http://www.voterfind.com/athensoh/vtrreport.aspx"
  ..- attr(*, "class")= chr "handle"
 $ config  :List of 7
  ..$ method    : NULL
  ..$ url       : NULL
  ..$ headers   : NULL
  ..$ fields    : NULL
  ..$ options   :List of 1
  .. ..$ autoreferer: int 1
  ..$ auth_token: NULL
  ..$ output    : NULL
  ..- attr(*, "class")= chr "request"
 $ url     : chr "http://www.voterfind.com/athensoh/underprocess.aspx"
 $ back    : chr(0) 
 $ forward : chr(0) 
 $ response:List of 10
  ..$ url        : chr "http://www.voterfind.com/athensoh/underprocess.aspx"
  ..$ status_code: int 200

有谁知道我怎样才能获得csv文件?

0 个答案:

没有答案