应用错误收集

我正在使用rvest包在R中进行抓取。我想从teambhp.com汽车的网页上搜集用户评论和评论。为以下链接执行此操作。 Team BHP REVIEW

我在r

中编写以下代码

library(rvest)
library(httr)
library(httpuv)

team_bhp <- read_html(httr::GET("http://www.team-bhp.com/forum/official-new-car-reviews/172150-tata-zica-official-review.html"))
all_tables <- team_bhp %>%
    html_nodes(".tcat:nth-child(1) , #posts strong , hr+ div") %>%
    html_text()

但我正在列出所有文本。并且包含空格和＆＃34; \ t \ n＆＃34;即使我正在应用html_text（）函数。如何清理它并转换为数据框。？

另外，我想对网站上提供的所有汽车评论进行此操作。我怎样才能递归遍历所有汽车的评论。？

使用rvest

0 个答案: