Rselenium无法获取页面源 - fromJSON错误

时间:2015-10-21 15:34:48

标签: json r selenium rselenium

我正在尝试使用RSelenium包,我注意到getPageSource()方法在某些网站上失败(但在其他网站上没有) - 请参阅此示例,使用Relenium文档中显示的网站:

library(RSelenium)
remDr = remoteDriver$new()
startServer()
remDr$open()

失败:

remDr$navigate("http://www.google.com")
left(remDr$getPageSource()[[1]],300)
  

fromJSON出错(内容,处理程序,default.size,深度,   allowComments,:无效的JSON输入

这成功了:

remDr$navigate("http://www.bbc.co.uk")
left(remDr$getPageSource()[[1]],300)
  

[1]“\ r \ nhttp://www.w3.org/1999/xhtml \”   lang = \“en \”class = \“orb-js bbcdotcom bbcdotcom-responsive ads-enabled   js flexbox flexboxlegacy csscolumns cssgradients csstransforms   fontface generatedcontent svg inlinesvg cssfilters bbcdotcom-init   bbccom-group-4 bbcdotcom-analytics-init wwhp“

有没有人知道获取网页资源的解决方案或解决方法?请注意,使用dos中描述的google网站的示例确实有效 - RSelenium可以在页面中查找和访问元素。只是getPageSource()方法失败了。

0 个答案:

没有答案