使用Rvest

时间:2018-06-26 04:23:32

标签: r rvest httr

我正在尝试从具有Rvest和httr许可证的受密码保护的网站上抓取数据。我有一个与帖子How to submit login form in Rvest package w/o button argument中类似的问题。但是,针对该帖子建议的解决方案对我不起作用。

我要抓取的网站的登录页面是:

https://cia.championdata.com/index.jsp

以下是到目前为止我尝试过的操作:

login_page <- "https://cia.championdata.com/index.jsp"
gh <- html_session(login_page) 
pgform <- html_form(gh)[[1]]

哪个返回以下内容:

<form> '<unnamed>' (POST #)
  <input text> 'username': 
  <input password> 'password':

我接下来按照上述SO帖子中的建议填写并提交表格:

filled_form <- set_values(pgform,'username' = '<MY USERNAME>', 'password' = '<MY PASSWORD>')
s <- submit_form(pgsession, filled_form)

哪个返回以下错误:

Error: Could not find possible submission target.

有很多关于此问题的SO帖子,但是在我的特定情况下,没有解决方案能够奏效。非常感谢我网站的任何建议。

0 个答案:

没有答案