向量数组的python协方差矩阵

时间:2019-11-18 17:51:58

标签: python classification linear-algebra

我有一个大小为4的向量数组(我们可以考虑4个元组)。我想找到协方差矩阵,但是如果我叫self.cov,我会得到一个巨大的矩阵,而我期望是4x4。 代码很简单 print(np.cov(iris_separated[0])),其中iris_separated [0]是虹膜数据集中的setosas。

print(iris_separated [0])看起来像这样

[[5.1 3.5 1.4 0.2]
 [4.9 3.  1.4 0.2]
 [4.7 3.2 1.3 0.2]
 [4.6 3.1 1.5 0.2]
 [5.  3.6 1.4 0.2]
 [5.4 3.9 1.7 0.4]
 [4.6 3.4 1.4 0.3]
 [5.  3.4 1.5 0.2]
 [4.4 2.9 1.4 0.2]
 [4.9 3.1 1.5 0.1]
 [5.4 3.7 1.5 0.2]
 [4.8 3.4 1.6 0.2]
 [4.8 3.  1.4 0.1]
 [4.3 3.  1.1 0.1]
 [5.8 4.  1.2 0.2]
 [5.7 4.4 1.5 0.4]
 [5.4 3.9 1.3 0.4]
 [5.1 3.5 1.4 0.3]
 [5.7 3.8 1.7 0.3]
 [5.1 3.8 1.5 0.3]
 [5.4 3.4 1.7 0.2]
 [5.1 3.7 1.5 0.4]
 [4.6 3.6 1.  0.2]
 [5.1 3.3 1.7 0.5]
 [4.8 3.4 1.9 0.2]
 [5.  3.  1.6 0.2]
 [5.  3.4 1.6 0.4]
 [5.2 3.5 1.5 0.2]
 [5.2 3.4 1.4 0.2]
 [4.7 3.2 1.6 0.2]
 [4.8 3.1 1.6 0.2]
 [5.4 3.4 1.5 0.4]
 [5.2 4.1 1.5 0.1]
 [5.5 4.2 1.4 0.2]
 [4.9 3.1 1.5 0.2]
 [5.  3.2 1.2 0.2]
 [5.5 3.5 1.3 0.2]
 [4.9 3.6 1.4 0.1]
 [4.4 3.  1.3 0.2]
 [5.1 3.4 1.5 0.2]
 [5.  3.5 1.3 0.3]
 [4.5 2.3 1.3 0.3]
 [4.4 3.2 1.3 0.2]
 [5.  3.5 1.6 0.6]
 [5.1 3.8 1.9 0.4]
 [4.8 3.  1.4 0.3]
 [5.1 3.8 1.6 0.2]
 [4.6 3.2 1.4 0.2]
 [5.3 3.7 1.5 0.2]
 [5.  3.3 1.4 0.2]]

我期望有一个4x4的协方差矩阵,相反,我得到的是一个尺寸很大的巨大矩阵。

[[4.75       4.42166667 4.35333333 ... 4.23       4.945      4.60166667]
 [4.42166667 4.14916667 4.055      ... 3.93833333 4.59916667 4.29583333]
 [4.35333333 4.055      3.99       ... 3.87666667 4.53166667 4.21833333]
 ...
 [4.23       3.93833333 3.87666667 ... 3.77       4.405      4.09833333]
 [4.945      4.59916667 4.53166667 ... 4.405      5.14916667 4.78916667]
 [4.60166667 4.29583333 4.21833333 ... 4.09833333 4.78916667 4.4625    ]]

2 个答案:

答案 0 :(得分:0)

print(np.cov(iris_separated [0],rowvar = False))解决了这个问题,对数据使用.T也解决了

答案 1 :(得分:0)

您需要转置矩阵。每列代表一个观察值,每行代表一个变量。因此,它应该是np.cov(iris_seperated[0].T)。 请参考文档

https://docs.scipy.org/doc/numpy/reference/generated/numpy.cov.html

相关问题