Question

我的问题在金融界很常见。

给定权重的数组w（1xN）和资产的协方差矩阵Q（NxN），可以使用二次表达式w'* Q * w计算投资组合的协方差，其中*是点积。 / p>

当我有权重W（T x N）的历史和协方差矩阵（T，N，N）的3D结构时，我想了解执行此操作的最佳方法是什么。

import numpy as np
import pandas as pd

returns = pd.DataFrame(0.1 * np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])
covariance = returns.rolling(20).cov()

weights = pd.DataFrame(np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])

到目前为止，我的解决方案是将pandas DataFrames转换为numpy，执行循环计算，然后转换回pandas。请注意，我需要明确检查标签的对齐方式，因为实际上协方差和权重可以通过不同的过程来计算。

cov_dict = {key: covariance.xs(key, axis=0, level=0) for key in covariance.index.get_level_values(0)}

def naive_numpy(weights, cov_dict):

    expected_risk = {}

    # Extract columns, index before passing to numpy arrays
    # Columns
    cov_assets = cov_dict[next(iter(cov_dict))].columns
    avail_assets = [el for el in cov_assets if el in weights]

    # Indexes
    cov_dates = list(cov_dict.keys())
    avail_dates = weights.index.intersection(cov_dates)

    sel_weights = weights.loc[avail_dates, avail_assets]

    # Main loop and calculation
    for t, value in zip(sel_weights.index, sel_weights.values):
        expected_risk[t] = np.sqrt(np.dot(value, np.dot(cov_dict[t].values, value)))

    # Back to pandas DataFrame
    expected_risk = pd.Series(expected_risk).reindex(weights.index).sort_index()

    return expected_risk

是否有纯熊猫的方法来达到同样的效果？或者代码是否有任何改进，以提高效率？（尽管使用numpy，它仍然很慢）。

Answer 1

我认为numpy绝对是最佳选择。虽然如果循环输入值/日期会降低效率。

我对计算投资组合的滚动波动性（无循环）的建议：

returns = pd.DataFrame(0.1 * np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])
covariance = returns.rolling(20).cov()
weights = pd.DataFrame(np.random.randn(100, 4), columns=['A', 'B', 'C', 'D'])

rows, columns = weights.shape

# Go to numpy:
w = weights.values
cov = covariance.values.reshape(rows, columns, columns)

A = np.matmul(w.reshape(rows, 1, columns), cov)
var = np.matmul(A, w.reshape(rows, columns, 1)).reshape(rows)
std_dev = np.sqrt(var)

# Back to pandas (in case you want that):
pd.Series(std_dev, index = weights.index)

熊猫点数产品与Multiindex

1 个答案: