Rselenium无法获取页面源 - fromJSON错误

时间：2015-10-21 15:34:48

标签： json r selenium rselenium

我正在尝试使用RSelenium包，我注意到getPageSource（）方法在某些网站上失败（但在其他网站上没有） - 请参阅此示例，使用Relenium文档中显示的网站：

library(RSelenium)
remDr = remoteDriver$new()
startServer()
remDr$open()

失败：

remDr$navigate("http://www.google.com")
left(remDr$getPageSource()[[1]],300)

fromJSON出错（内容，处理程序，default.size，深度， allowComments，：无效的JSON输入

这成功了：

remDr$navigate("http://www.bbc.co.uk")
left(remDr$getPageSource()[[1]],300)

[1]“\ r \ nhttp：//www.w3.org/1999/xhtml \” lang = \“en \”class = \“orb-js bbcdotcom bbcdotcom-responsive ads-enabled js flexbox flexboxlegacy csscolumns cssgradients csstransforms fontface generatedcontent svg inlinesvg cssfilters bbcdotcom-init bbccom-group-4 bbcdotcom-analytics-init wwhp“

有没有人知道获取网页资源的解决方案或解决方法？请注意，使用dos中描述的google网站的示例确实有效 - RSelenium可以在页面中查找和访问元素。只是getPageSource（）方法失败了。

0 个答案:

没有答案