Question

您好我想从资产分配，样式详情，行业权重和以下页面中删除表格信息。世界地区

http://portfolios.morningstar.com/fund/summary?t=SPY&region=usa&culture=en-US&ownerCountry=USA

我有以下代码，它给出了错误

BLOCK-LEVEL

Answer 1

在?html_table的示例中有以下示例：

births <- read_html("https://www.ssa.gov/oact/babynames/numberUSbirths.html")
html_table(html_nodes(births, "table")[[2]])

将此修改为您的案例似乎删除了错误。您可能需要更改[[2]]]，具体取决于您想要的内容。

library(rvest)
turl = 'http://portfolios.morningstar.com/fund/summary?t=SPY'
test_html = read_html(turl) 
df<-html_table(html_nodes(test_html, 'table')[[2]])

R中的链接刮表

1 个答案: