import numpy as np
import pandas as pd
from scipy.stats.stats import pearsonr
from cvxpy import Variable, Problem, Maximize
X = np.random.rand(1000, 4)
Y = np.random.rand(1000, 4)
weights = Variable(4,)
constraints = []
def get_correlation(a):
return pearsonr(X * a, Y *a)
obj = Maximize(get_correlation(weights))
problem = Problem(obj, constraints)
problem.solve()
我正在尝试使用cvxpy查找向量权重的值,以执行两个矩阵的线性转换。目标函数是两个变换矩阵之间的皮尔逊相关性最大化。
我不明白为什么会出现以下错误。
4 def get_correlation(a):
----> 5 return pearsonr(X * a, Y *a)
6
7 obj = Maximize(get_correlation(weights))
~/Python/global/lib/python3.6/site-packages/scipy/stats/stats.py in pearsonr(x, y)
3030 x = np.asarray(x)
3031 y = np.asarray(y)
-> 3032 n = len(x)
3033 mx = x.mean()
3034 my = y.mean()
TypeError: len() of unsized object
答案 0 :(得分:1)
您的错误是因为pearsonr
希望传递两个数组,例如输入x
和y
。
您在代码中创建了数组X
和Y
,是的。但是,如果您检查X * weights
的类型(实际上是您传递给pearsonr
的内容),您会看到它的类型为cvxpy.atoms.affine.binary_operators.MulExpression
,它没有长度属性,并且因此len(X * weights)
会引发错误。