如何使用R

时间:2016-08-04 14:52:24

标签: r web-scraping

我需要在vk.com中解析社交游戏的html数据(它是facebook的俄语模拟)。我试着下载html页面。

library(dplyr)
library(RCurl)
library(XML)
vk_roleGamesURL <- "https://vk.com/apps?act=genre18&id=18"
download.file(vk_roleGamesURL,
              destfile=vkRoleLocal <- paste0("vkRoleLocal.xml")) 

下载后打开并看到,它是开始登录页面,我需要输入我的电子邮件和密码。我该如何避免这个问题?我可以通过R登录吗?

1 个答案:

答案 0 :(得分:2)

由于本网站要求javascript正常运行:请查看https://cran.r-project.org/web/packages/RSelenium/vignettes/RSelenium-basics.html如何运作。

基本上它类似于以下内容:

1打开登录屏幕

require(RSelenium)
remDr <- remoteDriver(remoteServerAddr = "localhost" 
                      , port = 4444
                      , browserName = "firefox"
                      )
remDr$open()
remDr$navigate("https://vk.com/apps?act=genre18&id=18")

2登录

email <- remDr$findElement(using = "id", "email")
pass <- remDr$findElement(using = "id", "pass")
email$sendKeysToElement(list("YOUR EMAIL"))
pass$sendKeysToElement(list("YOUR PASS", "\uE007")) #\uE007 is the enter key

3以登录用户身份执行您想要做的事情