R用rvest,xml,iframe的第二页抓取文本

时间:2018-05-09 04:50:55

标签: r xml rvest

您好我想通过以下链接从投资目标中提取页面:

http://quote.morningstar.com/etf-filing/Prospectus/2018/1/18/t.aspx?t=SPY&ft=497&d=0833554effb2f4d14d1f23a561738303

我有以下代码,但问题是它刮擦并给了我第一页,而我希望提取实际部分和文本的第二页

linke = 'http://quote.morningstar.com/etf-filing/Prospectus/2018/1/18/t.aspx?t=SPY&ft=497&d=0833554effb2f4d14d1f23a561738303'

read_html(linke) %>% 
html_node("iframe.sec_frame") %>% 
html_attr("src") %>% 
read_html() -> pg

text1<-html_node(pg, xpath=".//div[contains(., 'Investment Objective')]") %>% 
html_text()

0 个答案:

没有答案