从R中的html doc检索表数据

时间:2016-01-08 06:59:23

标签: r web web-scraping html-parsing

我正在尝试从http://www.forbes.com/powerful-brands/list/#tab:rank检索最强大品牌的品牌数据。当我最初无法使用getURL和`HtmlParse检索数据时,我理解表数据来自其他链接。 为了方便起见,我下载了html页面并试图检索数据 我最初尝试使用

library(XML)
library(RCurl)
library(ggplot2)
forbes <- readHTMLTable("forbes.html",header = TRUE,as.data.frame = TRUE)
forbes

现在,当我显示福布斯时,我得到一份清单。虽然我会得到一个数据帧。

我在列表中查看了forbes$the_list中前10个品牌的数据,但没有找到其他公司的其他数据。即超过前10家公司。

如何从福布斯页面检索所有表格数据,以及如何将其转换为数据框以供我操作。

如果您需要任何进一步的信息,请与我们联系。

0 个答案:

没有答案