使用Rvest登录金融时报的网站

时间:2017-05-29 22:05:39

标签: r web-scraping rvest httr

我使用以下R代码登录FT网站,需要填写两种形式:第一种用于电子邮件,第二种用于密码。

library("rvest")
library(httr)
uastring="Mozilla/5.0 (Windows NT 10.0; WOW64; rv:53.0) Gecko/20100101 Firefox/53.0"
session1 <- html_session("https://accounts.ft.com/login")
uem="my@email"
pwd="mypassword"
form1 <- html_form(session1)[[1]]
form1 <- set_values(form1, email=uem)
session2 <- submit_form(session1, form1)
form2<- html_form(session2)[[1]]
form2 <- set_values(form2, email=uem,password=pwd,rememberMe="true")
session3 <- submit_form(session2, form2)
capture.output(cat(content(session3$response,as='text')),file="s3html.html")

最后一行是在提交我的凭据后获取网页。当我在Firefox中打开生成的html文档时,我看到登录不成功,错误代码为:LAE002(请参阅附图)。任何人都可以对此有所了解吗?非常感谢。

ft log in

0 个答案:

没有答案