我正在尝试通过 rvest 进行一些网页抓取,但似乎字段未被识别,并且在 set_values 函数上跳了起来:
session <- html_session("http://www.itto.int/annual_review_output/?mode=searchdata")
form <- html_form(session)[[2]]
set_values(form, countries = "1", products = "1" ,flows = "1", years = "1"))
submit_form(session, form)
会产生以下错误。
错误:未知字段名称:国家/地区,产品,流量,年份 submit_form(session,form)
任何建议表示赞赏。
答案 0 :(得分:1)
检查此网站时,您可以看到:
select size =“15”id =“countries”name =“countries []”multiple =“multiple”onChange =“selectCancel('groups');
所以name
元素是countries[]
set_values
其他参数是
提供要修改的字段的名称 - 值对
所以我认为你需要使用像
这样的smtset_values(form, "countries[]" = "1", "products[]" = "1" ,"flows[]" = "1", "years[]" = "1")