有没有办法自动获取许多股票的一般信息,如市盈率,收益率等等?

时间:2012-06-22 00:16:20

标签: python r stocks

我知道一些方法可以获得R或python中的每日股票价格和交易量,但只是想知道这些是否是一种方式(使用R或python)来获取有关股票的更多信息,如市盈率,公司网站,产量等等,最好不仅是当前值,还有历史值。

感谢。

2 个答案:

答案 0 :(得分:10)

历史将变得困难。 R的quantmod包具有getQuote,它与yahooQF一起将是您获取当前值所需的全部内容。

require("quantmod")
getQuote("GS", what = yahooQF(c("Market Capitalization", "Earnings/Share", 
         "P/E Ratio", "Book Value", "EBITDA", "52-week Range")))

            Trade Time Market Capitalization Earnings/Share P/E Ratio Book Value EBITDA  52-week Range
GS 2012-06-21 04:00:00               47.870B          6.764     14.27    134.476      0 84.27 - 139.25

另外,试试

getQuote("GS", what=yahooQF())

将为您提供一个选项,供您选择要求的字段。

您可以使用getFinancials

从Google财经获取最近的财务报表

还有FinancialInstrument个软件包,它有几个update_instruments.*函数来下载有关工具的元数据(在这种情况下是股票)。例如,这是雅虎所做的事情

require("FinancialInstrument")
stock("GS", currency("USD")) # define the stock
#[1] "GS"
update_instruments.yahoo("GS") #update with yahoo
#[1] "GS"
getInstrument("GS")
#primary_id          :"GS"
#currency            :"USD"
#multiplier          :1
#tick_size           :0.01
#identifiers         : list()
#type                :"stock"
#name                :"Goldman Sachs Gro"
#exchange            :"NYSE"
#market.cap          :"47.870B"
#avg.volume          :5480530
#EPS                 :6.76
#EPS.current.year.est:11.4
#EPS.next.year.est   :12.9
#book.value          :134
#EBITDA              :0
#range.52wk          :"84.27 - 139.25"
#defined.by          :"yahoo"
#updated             : POSIXct, format: "2012-06-21 19:31:11"

如果您有InteractiveBrokers帐户,则可以使用未完成的IBrokers包来获取有关大量乐器的大量信息。此外,如果您有一个IB帐户,您将需要查看具有许多便利功能的twsInstrument包。

答案 1 :(得分:2)

回答我问题的网站部分:

  str <- paste("http://investing.money.msn.com/investments/company-report?symbol=", ticker, sep = "")
  page <- paste(readLines(url(str, open = "rt")), collapse = "\n")
  match <- regexpr("<a href=\"http://www\\.(\\S+)\">Website</a>", page, perl = TRUE)

  if (attr(match, "match.length") > 0) {
    site <- substring(page, attr(match, "capture.start"), attr(match, "capture.start") + attr(match, "capture.length") - 1)    
    site <- strsplit(site, "/")[[1]][1]
  }