R:尝试从html页面和解析表中读取数据,但在htmlTreeParse()中获取Error

时间:2017-04-12 06:06:49

标签: r xml html-parsing

当我执行htmlTreeParser()时,我收到此错误:

  

htmlTreeParse出错(网页,错误=函数(...){:
      为。创建解析器时出错       另外:警告信息:
      XML内容似乎不是XML:''

请有人帮我调试。

library(RCurl)
library(XML)

theurl <- "http://www.forbes.com/powerful-brands/list/"
webpage <- getURL(theurl)
webpage <- readLines(tc <- textConnection(webpage)); close(tc)
pagetree <- htmlTreeParse(webpage, error=function(...){}, useInternalNodes = TRUE)

1 个答案:

答案 0 :(得分:1)

错误消息中明确说明了该问题。您提供的URL不直接指向XML页面。

试试这个:

theurl <- "https://www.forbes.com/powerful-brands/list/#tab:rank"