使用bplpapi的R中的Bloomberg数据提取问题,数据未填充,返回的开始日期不正确

时间:2019-08-19 18:17:05

标签: r bloomberg rblpapi

对于您在这里的所有彭博和R用户:

我通常没有问题通过Rblpapi包将Bloomberg数据导入R,但是在尝试提取索引级数据时遇到了一个问题。

问题是下面的代码在从1986年(不是1950年)开始提取数据时返回错误的结果,并留下了许多应填充的值NA。使用excel API,数据输入正常,但是我需要为某些字段添加“天= a”,因为它们直到1950年才开始。

可复制的示例(假设您具有Bloomberg访问权限):

    # Load packages  ----------------------------------------------------------
library("Rblpapi")
library("tidyverse")
library("lubridate")

# Connect to Bloomberg --------------------------------------------------
blpConnect()


# Pull equity index-level specific data over time for S&P 500, S&P Mid Cap (400) and S&P Small Cap (600) indices  ---------------------- 

# Index tickers
tickers <- c("SPX Index", "MID Index", "SML Index")


# Bloomberg inputs 
myField <- c("PX_LAST", "TRAIL_12M_EPS", "TRAIL_12M_DILUTED_EPS", "BEST_EPS", "PE_RATIO", "BEST_PE_RATIO", 
             "TRAIL_12M_EBITDA_PER_SHARE",  "PX_TO_EBITDA", "PX_TO_BOOK_RATIO", "PX_TO_SALES_RATIO",
             "PX_TO_FREE_CASH_FLOW", "EQY_DVD_YLD_12M", "TOT_DEBT_TO_EBITDA", "EV_TO_T12M_SALES", "EV_TO_T12M_EBITDA",
             "TRAIL_12M_GROSS_MARGIN", "EBITDA_MARGIN", "TRAIL_12M_OPER_MARGIN", "TRAIL_12M_PROF_MARGIN",
             "RETURN_ON_ASSET", "RETURN_COM_EQY",  "RETURN_ON_CAP", "NET_DEBT_TO_EBITDA", "CUR_MKT_CAP", "AVERAGE_MARKET_CAP"
             )

# Pull data
sp_indices_fundmtls_raw <- as.data.frame(bdh(tickers,
                                             myField,
                                             start.date = as.Date("1950-01-01"),
                                             end.date   = Sys.Date(),
                                             include.non.trading.days = TRUE
                                             )
                                         )

由于此操作无效,因此我尝试仅使用SPX Index提取数据。同样的问题。然后,我用更少的代码尝试了该公式

# Bloomberg inputs 
myField <- c("PX_LAST", "TRAIL_12M_EPS", "TRAIL_12M_DILUTED_EPS", "BEST_EPS", "PE_RATIO", "BEST_PE_RATIO", 
             "TRAIL_12M_EBITDA_PER_SHARE",  "PX_TO_EBITDA", "PX_TO_BOOK_RATIO", "PX_TO_SALES_RATIO",
             "PX_TO_FREE_CASH_FLOW", "EQY_DVD_YLD_12M",
             "TOT_DEBT_TO_EBITDA", "EV_TO_T12M_SALES", "EV_TO_T12M_EBITDA"
             )

效果更好,但仍然始于1964年,而不是1950年。同样,excel API可以正常工作,并且如果我想像R会更早丢失数据,它将只返回NA。

这使我认为必须有一个字段需要选择或覆盖才能正确提取数据。我尝试添加

ovrd <- c("PERIODICITY_OVERRIDE" = "D")


# Pull data
sp_indices_fundmtls_raw <- as.data.frame(bdh(tickers,
                                             myField,
                                             start.date = as.Date("1950-01-01"),
                                             end.date   = Sys.Date(),
                                             include.non.trading.days = TRUE,
                                             overrides = ovrd

                                             )
                                         )

但是没有运气。

有人能找出问题吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

经过反复尝试,我找到了一种获取数据的方法。

我创建了一个提取数据的函数:

      # Function to pull data
sp_indices_pull_fx <- function(myField, index_ticker) {
  df <- as.data.frame(bdh(index_ticker,
                          myField,
                          start.date = as.Date("1950-01-01"),
                          end.date   = Sys.Date(),
                          include.non.trading.days = TRUE
                          )
                      )

然后我用lapply循环遍历每个股票。例如:

    # SP500
sp_500_pull      <- lapply(myField, sp_indices_pull_fx, index_ticker = "SPX Index")

然后我将这些结果合并到一个数据框中:

  # Merge
sp_500_fundmtls_raw      = Reduce(function(...) merge(..., all = TRUE), sp_500_pull)

简而言之,有效的方法是创建一个函数并为每个单独的代码提供功能,而不是尝试使用bdh函数一次拉多个代码。