R - xmlnodeset输出到dataframe或table

时间:2016-06-22 06:52:54

标签: r csv xmlnode rvest

我试图在两个不同页面的csv文件行中保存html代码块。

  1. 取得两个链接
  2. 使用循环访问链接并使用rvest
  3. 选择两个html代码块
  4. 使用sapply打印它们
  5. 想要在csv文件中连续打印输出(需要帮助)
  6. 我可以在控制台中看到html块但不能将它们保存在csv中。我想保存html代码而不是值。我将IMDB用于代码复制目的。

    library(rvest   
     movielinks <- c("http://www.imdb.com/movies-coming-soon/?ref_=inth_cs", "http://www.imdb.com/movies-in-theaters/?ref_=nv_tp_inth_1")
    
    
         moviesheet <- NULL
    
        for (mov in 1: length(movielinks)) {
    
           #print(mov)
           pageurl <- paste0(movielinks[mov])
           # print(pageurl)
    
           movieurl <- html(pageurl)
    
       movie_name <- movieurl %>% 
         html_nodes("h4 a ")# %>%       # find all links
    
    
    
       strings<-paste(sapply(movie_name, function(x) { print(x) }))
       moviesheet <- rbind(moviesheet, strings)
    
    }
    write.csv(moviesheet, "moviesheet.csv")
    

    最终结果是这样的

    Product Price HtmlCode
    Soap     20     <a href="/title/tt3691740/?ref_=cs_ov_tt" title="
                     The BFG (2016)" 
                      itemprop="url"> The BFG (2016)</a> 
    

0 个答案:

没有答案