这个问题与其说是如何在R中谷歌搜索(之前已经讨论过多次),还不如说它为什么并不总是有效。
我在另一个发布的问题here中找到了此代码 我记得做得很好。它将产生搜索中的所有链接。
但是现在不起作用。由于某种原因,当我将数据拖入R时,该节点不再存在。但是当我实际在Chrome上检查html代码时,当我浏览代码时它就在该位置。它显示的是显示检查器中的h3
节点,但向下倾斜时则不显示。
library(rvest)
ht <- read_html('https://www.google.co.in/search?q=guitar+repair+workshop')
links <- ht %>% html_nodes(xpath='//h3/a') %>% html_attr('href')
gsub('/url\\?q=','',sapply(strsplit(links[as.vector(grep('url',links))],split='&'),'[',1))
我得到以下回报:
character(0)
链接的google页面显示取决于您的位置/偏好。那么,这可能是导致问题的原因吗?
答案 0 :(得分:1)
似乎是最近(也许是今天)切换了格式,并且// h3不再使用。这将产生预期的结果,并最终获得无关的结果
library(rvest)
ht <- read_html('https://www.google.co.in/search?q=guitar+repair+workshop')
links <- ht %>% html_nodes(xpath='//a') %>% html_attr('href')
gsub('/url\\?q=','',sapply(strsplit(links[as.vector(grep('url',links))],split='&'),'[',1))