我正在尝试从具有Rvest和httr许可证的受密码保护的网站上抓取数据。我有一个与帖子How to submit login form in Rvest package w/o button argument中类似的问题。但是,针对该帖子建议的解决方案对我不起作用。
我要抓取的网站的登录页面是:
https://cia.championdata.com/index.jsp
以下是到目前为止我尝试过的操作:
login_page <- "https://cia.championdata.com/index.jsp"
gh <- html_session(login_page)
pgform <- html_form(gh)[[1]]
哪个返回以下内容:
<form> '<unnamed>' (POST #)
<input text> 'username':
<input password> 'password':
我接下来按照上述SO帖子中的建议填写并提交表格:
filled_form <- set_values(pgform,'username' = '<MY USERNAME>', 'password' = '<MY PASSWORD>')
s <- submit_form(pgsession, filled_form)
哪个返回以下错误:
Error: Could not find possible submission target.
有很多关于此问题的SO帖子,但是在我的特定情况下,没有解决方案能够奏效。非常感谢我网站的任何建议。