我试图在两个不同页面的csv文件行中保存html代码块。
我可以在控制台中看到html块但不能将它们保存在csv中。我想保存html代码而不是值。我将IMDB用于代码复制目的。
library(rvest
movielinks <- c("http://www.imdb.com/movies-coming-soon/?ref_=inth_cs", "http://www.imdb.com/movies-in-theaters/?ref_=nv_tp_inth_1")
moviesheet <- NULL
for (mov in 1: length(movielinks)) {
#print(mov)
pageurl <- paste0(movielinks[mov])
# print(pageurl)
movieurl <- html(pageurl)
movie_name <- movieurl %>%
html_nodes("h4 a ")# %>% # find all links
strings<-paste(sapply(movie_name, function(x) { print(x) }))
moviesheet <- rbind(moviesheet, strings)
}
write.csv(moviesheet, "moviesheet.csv")
最终结果是这样的
Product Price HtmlCode
Soap 20 <a href="/title/tt3691740/?ref_=cs_ov_tt" title="
The BFG (2016)"
itemprop="url"> The BFG (2016)</a>