我正在尝试使用 rvest 库在网上抓取 Goodreads 对“一点生活”一书的评分和评论。 我编写了下面的代码,它运行良好,但它只抓取了显示的前 30 个结果。如果我点击“下一页”看到下面的 30(31 到 60)页的 url 保持不变,所以我不能使用这种方法来抓取它们。 你有什么建议吗? 谢谢!
library(rvest)
library(tidyverse)
url <- ("https://www.goodreads.com/book/show/22822858-a-little-life")
all_html <- read_html(url)
# Get the username
username <- all_html %>%
html_nodes("div#bookReviews") %>%
html_nodes("div.left.bodycol") %>%
html_nodes("div.reviewHeader.uitext.stacked") %>%
html_nodes('.user') %>%
html_text()
```