我需要在vk.com中解析社交游戏的html数据(它是facebook的俄语模拟)。我试着下载html页面。
library(dplyr)
library(RCurl)
library(XML)
vk_roleGamesURL <- "https://vk.com/apps?act=genre18&id=18"
download.file(vk_roleGamesURL,
destfile=vkRoleLocal <- paste0("vkRoleLocal.xml"))
下载后打开并看到,它是开始登录页面,我需要输入我的电子邮件和密码。我该如何避免这个问题?我可以通过R登录吗?
答案 0 :(得分:2)
由于本网站要求javascript正常运行:请查看https://cran.r-project.org/web/packages/RSelenium/vignettes/RSelenium-basics.html如何运作。
基本上它类似于以下内容:
1打开登录屏幕
require(RSelenium)
remDr <- remoteDriver(remoteServerAddr = "localhost"
, port = 4444
, browserName = "firefox"
)
remDr$open()
remDr$navigate("https://vk.com/apps?act=genre18&id=18")
2登录
email <- remDr$findElement(using = "id", "email")
pass <- remDr$findElement(using = "id", "pass")
email$sendKeysToElement(list("YOUR EMAIL"))
pass$sendKeysToElement(list("YOUR PASS", "\uE007")) #\uE007 is the enter key
3以登录用户身份执行您想要做的事情