熊猫点数产品与Multiindex

时间:2018-02-21 10:03:22

标签: python pandas numpy financial

我的问题在金融界很常见。

给定权重的数组w(1xN)和资产的协方差矩阵Q(NxN),可以使用二次表达式w'* Q * w计算投资组合的协方差,其中*是点积。 / p>

当我有权重W(T x N)的历史和协方差矩阵(T,N,N)的3D结构时,我想了解执行此操作的最佳方法是什么。

import numpy as np
import pandas as pd

returns = pd.DataFrame(0.1 * np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])
covariance = returns.rolling(20).cov()

weights = pd.DataFrame(np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])

到目前为止,我的解决方案是将pandas DataFrames转换为numpy,执行循环计算,然后转换回pandas。 请注意,我需要明确检查标签的对齐方式,因为实际上协方差和权重可以通过不同的过程来计算。

cov_dict = {key: covariance.xs(key, axis=0, level=0) for key in covariance.index.get_level_values(0)}

def naive_numpy(weights, cov_dict):

    expected_risk = {}

    # Extract columns, index before passing to numpy arrays
    # Columns
    cov_assets = cov_dict[next(iter(cov_dict))].columns
    avail_assets = [el for el in cov_assets if el in weights]

    # Indexes
    cov_dates = list(cov_dict.keys())
    avail_dates = weights.index.intersection(cov_dates)

    sel_weights = weights.loc[avail_dates, avail_assets]

    # Main loop and calculation
    for t, value in zip(sel_weights.index, sel_weights.values):
        expected_risk[t] = np.sqrt(np.dot(value, np.dot(cov_dict[t].values, value)))

    # Back to pandas DataFrame
    expected_risk = pd.Series(expected_risk).reindex(weights.index).sort_index()

    return expected_risk

是否有纯熊猫的方法来达到同样的效果?或者代码是否有任何改进,以提高效率? (尽管使用numpy,它仍然很慢)。

1 个答案:

答案 0 :(得分:0)

我认为numpy绝对是最佳选择。虽然如果循环输入值/日期会降低效率。

我对计算投资组合的滚动波动性(无循环)的建议:

returns = pd.DataFrame(0.1 * np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])
covariance = returns.rolling(20).cov()
weights = pd.DataFrame(np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])

rows, columns = weights.shape

# Go to numpy:
w = weights.values
cov = covariance.values.reshape(rows, columns, columns)

A = np.matmul(w.reshape(rows, 1, columns), cov)
var = np.matmul(A, w.reshape(rows, columns, 1)).reshape(rows)
std_dev = np.sqrt(var)

# Back to pandas (in case you want that):
pd.Series(std_dev, index = weights.index)