与rvest的未知领域

时间:2016-03-23 06:33:24

标签: r web-scraping rvest

我正在尝试通过 rvest 进行一些网页抓取,但似乎字段未被识别,并且在 set_values 函数上跳了起来:

session <- html_session("http://www.itto.int/annual_review_output/?mode=searchdata")
form <- html_form(session)[[2]]
set_values(form, countries = "1", products = "1" ,flows = "1", years = "1"))
submit_form(session, form)

会产生以下错误。

  

错误:未知字段名称:国家/地区,产品,流量,年份   submit_form(session,form)

任何建议表示赞赏。

1 个答案:

答案 0 :(得分:1)

检查此网站时,您可以看到:

  

select size =“15”id =“countries”name =“countries []”multiple =“multiple”onChange =“selectCancel('groups');

所以name元素是countries[]

<{1>} set_values其他参数是

  

提供要修改的字段的名称 - 值对

所以我认为你需要使用像

这样的smt
set_values(form, "countries[]" = "1", "products[]" = "1" ,"flows[]" = "1", "years[]" = "1")