我无法抓取特定酒店的所有评论(我需要全文评论)。
我尝试了一些功能,例如“ .nav.next”和“ jump_to”,但是由于某些原因,代码无法正常工作。代码如下:
url <- read_html ("https://www.tripadvisor.com/ShowUserReviews-g297630-d1194844-r675391794-The_Gateway_Hotel_Old_Port_Rd_Mangalore-Mangalore_Dakshina_Kannada_District_Karn.html")
getXreviews10pages <- function(url, X){
data <- data.frame()
i = 1
for(i in 1:X){
if(i != 1){ # Go to next page but don't skip the first page
next_URL <- html_nodes(url, ".nav.next") %>%
html_attr("href")
url <- jump_to(url, paste0("https://www.tripadvisor.com", next_URL))
}
reviewpages <- url %>%
html_nodes(".is-9 > .prw_reviews_text_summary_hsx .partial_entry") %>%
print(paste0("Page ", i))
}
data
}
hotels_reviews <- getXreviews10pages(url, 10)
所以我希望它能显示前10页的所有评论。 “ .nav.next”和jump_to应该会转到下一页,然后再跳转到下一页,并刮掉所有评论。
我不是编码员,但我的硕士论文需要审阅。我在网上找不到任何帮助。预先感谢您提供任何答案!