如何抓取所有全文评论Tripadvisor

时间:2019-05-22 20:13:08

标签: r web-scraping review tripadvisor

我无法抓取特定酒店的所有评论(我需要全文评论)。

我尝试了一些功能,例如“ .nav.next”和“ jump_to”,但是由于某些原因,代码无法正常工作。代码如下:

url <- read_html ("https://www.tripadvisor.com/ShowUserReviews-g297630-d1194844-r675391794-The_Gateway_Hotel_Old_Port_Rd_Mangalore-Mangalore_Dakshina_Kannada_District_Karn.html")

getXreviews10pages <- function(url, X){
   data <- data.frame()
   i = 1
   for(i in 1:X){
     if(i != 1){ # Go to next page but don't skip the first page
       next_URL <- html_nodes(url, ".nav.next") %>%
          html_attr("href")
       url <- jump_to(url, paste0("https://www.tripadvisor.com", next_URL))
     }
     reviewpages <- url %>%
     html_nodes(".is-9 > .prw_reviews_text_summary_hsx .partial_entry") %>%
     print(paste0("Page ", i))
    }
   data
  }

hotels_reviews <- getXreviews10pages(url, 10)

所以我希望它能显示前10页的所有评论。 “ .nav.next”和jump_to应该会转到下一页,然后再跳转到下一页,并刮掉所有评论。

我不是编码员,但我的硕士论文需要审阅。我在网上找不到任何帮助。预先感谢您提供任何答案!

0 个答案:

没有答案