使用rvest

时间:2016-02-03 11:47:29

标签: r web-scraping rvest

我正在使用rvest包在R中进行抓取。 我想从teambhp.com汽车的网页上搜集用户评论和评论。 为以下链接执行此操作。 Team BHP REVIEW

我在r

中编写以下代码
library(rvest)
library(httr)
library(httpuv)

team_bhp <- read_html(httr::GET("http://www.team-bhp.com/forum/official-new-car-reviews/172150-tata-zica-official-review.html"))
all_tables <- team_bhp %>%
    html_nodes(".tcat:nth-child(1) , #posts strong , hr+ div") %>%
    html_text()

但我正在列出所有文本。并且包含空格和&#34; \ t \ n&#34;即使我正在应用html_text()函数。如何清理它并转换为数据框。 ?

另外,我想对网站上提供的所有汽车评论进行此操作。我怎样才能递归遍历所有汽车的评论。 ?

0 个答案:

没有答案