抓取谷歌新闻类更改

时间:2021-07-13 14:06:07

标签: r web-scraping css-selectors rvest google-news

我正在尝试使用从之前的帖子 (https://stackoverflow.com/a/60549550/16439932) 中找到的以下脚本抓取谷歌新闻,但“dat”为空。似乎 .VDXfz 类不再存在。我应该如何更换它?

html_dat <- read_html(paste0("https://news.google.com/search?q=coronavirus&hl=en-US&gl=US&ceid=US%3Aen"))

  dat <- data.frame(Link = html_dat %>%
                      html_nodes('.VDXfz') %>% 
                      html_attr('href')) %>% 
    mutate(Link = gsub("./articles/","https://news.google.com/articles/",Link))

  news_dat <- data.frame(
    Title = html_dat %>%
      html_nodes('.DY5T1d') %>% 
      html_text(),
    Link = dat$Link,
    Description =  html_dat %>%
      html_nodes('.Rai5ob') %>% 
      html_text()
  )

0 个答案:

没有答案
相关问题