使用R,rvest,Rcurl从网页上刮取财务表

时间:2016-04-28 16:09:36

标签: r rvest

我正在尝试从网页解析财务表格。我继续说但我无法安排列表或data.frame

library(rvest)
link <- "http://www.marketwatch.com/investing/stock/garan/financials/balance-sheet/quarter"
read <- read_html(link)
prs <- html_nodes(read, ".financials")
irre <- html_text(prs)
re <- strsplit(irre, split = "\r\n")

re是这样的:

[27]“资产”
 [28]“”  [29]“”  [30]“”  [31]“所有价值数百万美元。”  [32]“31-Dec-201431-Mar-201530-Jun-201530-Sep-201531-Dec-2015”
 [33]“5-qtr趋势”
 [34]“”  [35]“”  [36]“”  [37]“”  [38]“银行现金及到期总额”
 [39]“27.26B26.27B26.7B34.51B27.9B”
 [40]“”  [41]“”  bla bla ...

如何通过与此page

正确相似的data.frame编辑此列表

1 个答案:

答案 0 :(得分:0)

尝试

library(XML)

theurl <- "http://www.marketwatch.com/investing/stock/garan/financials/balance-sheet/quarter"
re <- readHTMLTable(theurl)

结果是一个包含两个数据帧的列表。