我正在尝试使用RSelenium包,我注意到getPageSource()方法在某些网站上失败(但在其他网站上没有) - 请参阅此示例,使用Relenium文档中显示的网站:
library(RSelenium)
remDr = remoteDriver$new()
startServer()
remDr$open()
remDr$navigate("http://www.google.com")
left(remDr$getPageSource()[[1]],300)
fromJSON出错(内容,处理程序,default.size,深度, allowComments,:无效的JSON输入
remDr$navigate("http://www.bbc.co.uk")
left(remDr$getPageSource()[[1]],300)
[1]“\ r \ nhttp://www.w3.org/1999/xhtml \” lang = \“en \”class = \“orb-js bbcdotcom bbcdotcom-responsive ads-enabled js flexbox flexboxlegacy csscolumns cssgradients csstransforms fontface generatedcontent svg inlinesvg cssfilters bbcdotcom-init bbccom-group-4 bbcdotcom-analytics-init wwhp“
有没有人知道获取网页资源的解决方案或解决方法?请注意,使用dos中描述的google网站的示例确实有效 - RSelenium可以在页面中查找和访问元素。只是getPageSource()方法失败了。