用Scipy定义正交的多元高斯函数

时间:2016-09-30 20:22:17

标签: python scipy statistics gaussian numerical-integration

我在使用scipy为正交定义多元高斯pdf时遇到了一些麻烦。我编写了一个函数,它将平均向量和协方差矩阵作为输入,并返回高斯函数。

def make_mvn_pdf(mu, sigma):
    def f(x):
        return sp.stats.multivariate_normal.pdf(x, mu, sigma)
    return f

当我使用make_mvn_pdf来定义高斯并尝试索引高斯时,我得到一个没有意义的错误。我首先定义一个均值向量和协方差矩阵并将它们传递给make_mvn_pdf:

# define covariance matrix
Sigma = np.asarray([[1, .15], [.15, 1]])
# define propagator
B = np.diag([2, 2])
# define data
Obs = np.array([[-0.06895746],[ 0.18778   ]])

# define a Gaussian PDF:
g_int_func = make_mvn_pdf(mean = np.dot(B,Obs[t,:]), cov = Sigma)

我尝试将观察结果传递给密度以便找回概率:

testarray=np.random.random((2,2))
g_int_func(testarray)

这会返回以下错误,我不明白。

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-50-083a1915f674> in <module>()
  1 g_int_func = make_mvn_pdf(np.dot(B,Obs[t,:]),Gamma)
----> 2 g_int_func(testarray)

/Users/...in f(x)
 17 def make_mvn_pdf(mu, sigma):
 18     def f(x):
---> 19         return sp.stats.multivariate_normal.pdf(x, mu, sigma)
 20     return f
 21 

/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/scipy/stats/_multivariate.pyc in pdf(self, x, mean, cov, allow_singular)
427 
428         """
--> 429         dim, mean, cov = _process_parameters(None, mean, cov)
430         x = _process_quantiles(x, dim)
431         psd = _PSD(cov, allow_singular=allow_singular)

/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/scipy/stats/_multivariate.pyc in _process_parameters(dim, mean, cov)
 54 
 55     if mean.ndim != 1 or mean.shape[0] != dim:
---> 56         raise ValueError("Array 'mean' must be a vector of length %d." % dim)
 57     if cov.ndim == 0:
 58         cov = cov * np.eye(dim)

ValueError: Array 'mean' must be a vector of length 2.

ValueError声明数组&#39;表示&#39;必须是长度为2的向量,但情况就是如此。实际上,均值和协方差矩阵的维数以及传入的数据都是长度为2的。

1 个答案:

答案 0 :(得分:2)

您提供的平均值为np.dot(B, Obs)(考虑到您在评论中建议的更改),其中B具有形状(2,2)和Obs形状(2,1)。 dot调用的结果具有形状(2,1)。问题是两个 - 维数组,multivariate_normal.pdf期望mu一个维数组,即形状为数组的数组(2)。 (错误消息使用单词&#34; vector&#34;,这是一个糟糕的选择,因为对于许多人来说,具有形状(n,1)的数组是 a(列)向量。如果错误消息表示&#34;数组&#39;表示必须是长度为2的一维数组,那就不那么模糊了。&#34;)

至少有两种简单的方法可以解决问题:

  • 您可以确保Obs具有形状(2,)而不是(2,1),例如Obs = np.array([-0.06895746, 0.18778])np.dot(B, Obs)具有形状(2,)。
  • &#34;平铺&#34; mean方法使用ravel方法:mean=np.dot(B,Obs).ravel()