R中的链接刮表

时间:2017-11-26 07:10:13

标签: r web-scraping rvest

您好我想从资产分配,样式详情,行业权重和以下页面中删除表格信息。世界地区

http://portfolios.morningstar.com/fund/summary?t=SPY&region=usa&culture=en-US&ownerCountry=USA

我有以下代码,它给出了错误

BLOCK-LEVEL

1 个答案:

答案 0 :(得分:0)

?html_table的示例中有以下示例:

births <- read_html("https://www.ssa.gov/oact/babynames/numberUSbirths.html")
html_table(html_nodes(births, "table")[[2]])

将此修改为您的案例似乎删除了错误。您可能需要更改[[2]]],具体取决于您想要的内容。

library(rvest)
turl = 'http://portfolios.morningstar.com/fund/summary?t=SPY'
test_html = read_html(turl) 
df<-html_table(html_nodes(test_html, 'table')[[2]])