如何解析S& P500 P / E比例的网页

时间:2016-06-21 14:25:17

标签: html r

我正在尝试从此网页导入S& P 500的当前市盈率: http://www.multpl.com 在图表下方,它表示"当前:",提供当前值(今天的值为24.11)。

有没有办法解析此网页以自动将其导入R?

1 个答案:

答案 0 :(得分:2)

如果您只需要PE口粮,您可以使用此

library(XML)
library(stringr)
url<-htmlParse("http://www.multpl.com/")
PE<-xpathSApply(url,"//div[@id='current']",xmlValue)
str<-str_replace_all(PE," ","")
str<-str_replace_all(str,"\n","")
begin<-str_locate(str,":")[[1]]
end<-str_locate(str,"\\+")[[1]]
PE_ratio<-as.numeric(str_sub(str,begin+1,end-1))
PE_ratio