使用R登录后从网站上抓取.txt表

时间:2018-09-06 13:28:31

标签: r rvest scrape

Ciao,我可以访问学生服务器,出于数据安全原因,我在这里不能确定。但是我发现一个弹出类似样式的网站。基本上,我需要转到一个URL,单击一个链接来访问数据-这会带来一个弹出的登录框,然后我需要获取其背后的数据。它看起来类似于附件的图像。enter image description here看到没有用于登录信息的特定URL,因此我不知道如何使用我的登录信息来重定向URL。我确实找到了代码,并对其进行了编辑,但它没有保存所需的表。最后,由于出于安全原因,我无法共享实际的URL,因此使该副本具有可复制性。如果您有建议,我会很荣幸。谢谢。

1 个答案:

答案 0 :(得分:0)

如果您使用html_form软件包中的submit_formrvest登录,可能会有所帮助。这是最小的示例:

library(rvest)
# Establish first session connection
url <- "https://www.wesbite.co.uk" 
sp.session <- html_session(url)
fe         <- html_form(sp.session)

# Set values - manually
fe[[1]][["fields"]]$value <- "login details"

# Submit form and get new session
sp.session <- rvest::submit_form(sp.session, fe[[1]])
相关问题