Question

我正在尝试从网页解析财务表格。我继续说但我无法安排列表或data.frame

library(rvest)
link <- "http://www.marketwatch.com/investing/stock/garan/financials/balance-sheet/quarter"
read <- read_html(link)
prs <- html_nodes(read, ".financials")
irre <- html_text(prs)
re <- strsplit(irre, split = "\r\n")

re是这样的：

[27]“资产”
[28]“” [29]“” [30]“” [31]“所有价值数百万美元。” [32]“31-Dec-201431-Mar-201530-Jun-201530-Sep-201531-Dec-2015”
[33]“5-qtr趋势”
[34]“” [35]“” [36]“” [37]“” [38]“银行现金及到期总额”
[39]“27.26B26.27B26.7B34.51B27.9B”
[40]“” [41]“” bla bla ...

如何通过与此page

正确相似的data.frame编辑此列表

Answer 1

尝试

library(XML)

theurl <- "http://www.marketwatch.com/investing/stock/garan/financials/balance-sheet/quarter"
re <- readHTMLTable(theurl)

结果是一个包含两个数据帧的列表。

使用R，rvest，Rcurl从网页上刮取财务表

1 个答案: