Google搜索R

时间:2019-05-29 17:36:58

标签: r

这个问题与其说是如何在R中谷歌搜索(之前已经讨论过多次),还不如说它为什么并不总是有效。

我在另一个发布的问题here中找到了此代码 我记得做得很好。它将产生搜索中的所有链接。

但是现在不起作用。由于某种原因,当我将数据拖入R时,该节点不再存在。但是当我实际在Chrome上检查html代码时,当我浏览代码时它就在该位置。它显示的是显示检查器中的h3节点,但向下倾斜时则不显示。

library(rvest)
ht <- read_html('https://www.google.co.in/search?q=guitar+repair+workshop')
links <- ht %>% html_nodes(xpath='//h3/a') %>% html_attr('href')
gsub('/url\\?q=','',sapply(strsplit(links[as.vector(grep('url',links))],split='&'),'[',1))

我得到以下回报:

 character(0)

链接的google页面显示取决于您的位置/偏好。那么,这可能是导致问题的原因吗?

1 个答案:

答案 0 :(得分:1)

似乎是最近(也许是今天)切换了格式,并且// h3不再使用。这将产生预期的结果,并最终获得无关的结果

    library(rvest)
    ht <- read_html('https://www.google.co.in/search?q=guitar+repair+workshop')
    links <- ht %>% html_nodes(xpath='//a') %>% html_attr('href')
    gsub('/url\\?q=','',sapply(strsplit(links[as.vector(grep('url',links))],split='&'),'[',1))