第一次尝试从Morningstar的网站上抓取一些财务数据。
具体来说,我正在尝试抓取以下公司的“每股自由现金流”数据:Hongkong Land Holdings
我已经使用选择器小工具突出显示了我想要的数据。以下屏幕截图显示了我的工作。
我尝试使用以下R脚本获取每股自由现金流数据。但是,从html_nodes
函数返回的列表是0列表。我尝试使用Selector Gadget的css以及xpath。两种方法均未取得理想的结果。
library(rvest)
url <- "http://financials.morningstar.com/ratios/r.html?t=H78"
webpage <- read_html(url)
FCF_per_share <- html_nodes(webpage, css = "#i90 , tr:nth-child(28) td, :nth-child(7) :nth-child(11) :nth-child(6) :nth-child(5) :nth-child(3) td:nth-child(4)")
FCF_per_share <- html_nodes(webpage, xpath = "//*[(@id = "i90")] | //tr[(((count(preceding-sibling::*) + 1) = 28) and parent::*)]//td//*[(((count(preceding-sibling::*) + 1) = 7) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 11) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 6) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 5) and parent::*)]//*[(((count(preceding-sibling::*) + 1) = 3) and parent::*)]//td[(((count(preceding-sibling::*) + 1) = 4) and parent::*)]")
我尝试查看上面的网页变量。它是2的列表。当我尝试在webpage变量上使用方括号时,得到以下结果(不确定其含义以及是否正确):
webpage[[1]]
<pointer: 0x07928060>
webpage[[2]]
<pointer: 0x0778adc8>
非常感谢帮助。谢谢!