我有一个大小为4的向量数组(我们可以考虑4个元组)。我想找到协方差矩阵,但是如果我叫self.cov,我会得到一个巨大的矩阵,而我期望是4x4。
代码很简单
print(np.cov(iris_separated[0]))
,其中iris_separated [0]是虹膜数据集中的setosas。
print(iris_separated [0])看起来像这样
[[5.1 3.5 1.4 0.2]
[4.9 3. 1.4 0.2]
[4.7 3.2 1.3 0.2]
[4.6 3.1 1.5 0.2]
[5. 3.6 1.4 0.2]
[5.4 3.9 1.7 0.4]
[4.6 3.4 1.4 0.3]
[5. 3.4 1.5 0.2]
[4.4 2.9 1.4 0.2]
[4.9 3.1 1.5 0.1]
[5.4 3.7 1.5 0.2]
[4.8 3.4 1.6 0.2]
[4.8 3. 1.4 0.1]
[4.3 3. 1.1 0.1]
[5.8 4. 1.2 0.2]
[5.7 4.4 1.5 0.4]
[5.4 3.9 1.3 0.4]
[5.1 3.5 1.4 0.3]
[5.7 3.8 1.7 0.3]
[5.1 3.8 1.5 0.3]
[5.4 3.4 1.7 0.2]
[5.1 3.7 1.5 0.4]
[4.6 3.6 1. 0.2]
[5.1 3.3 1.7 0.5]
[4.8 3.4 1.9 0.2]
[5. 3. 1.6 0.2]
[5. 3.4 1.6 0.4]
[5.2 3.5 1.5 0.2]
[5.2 3.4 1.4 0.2]
[4.7 3.2 1.6 0.2]
[4.8 3.1 1.6 0.2]
[5.4 3.4 1.5 0.4]
[5.2 4.1 1.5 0.1]
[5.5 4.2 1.4 0.2]
[4.9 3.1 1.5 0.2]
[5. 3.2 1.2 0.2]
[5.5 3.5 1.3 0.2]
[4.9 3.6 1.4 0.1]
[4.4 3. 1.3 0.2]
[5.1 3.4 1.5 0.2]
[5. 3.5 1.3 0.3]
[4.5 2.3 1.3 0.3]
[4.4 3.2 1.3 0.2]
[5. 3.5 1.6 0.6]
[5.1 3.8 1.9 0.4]
[4.8 3. 1.4 0.3]
[5.1 3.8 1.6 0.2]
[4.6 3.2 1.4 0.2]
[5.3 3.7 1.5 0.2]
[5. 3.3 1.4 0.2]]
我期望有一个4x4的协方差矩阵,相反,我得到的是一个尺寸很大的巨大矩阵。
[[4.75 4.42166667 4.35333333 ... 4.23 4.945 4.60166667]
[4.42166667 4.14916667 4.055 ... 3.93833333 4.59916667 4.29583333]
[4.35333333 4.055 3.99 ... 3.87666667 4.53166667 4.21833333]
...
[4.23 3.93833333 3.87666667 ... 3.77 4.405 4.09833333]
[4.945 4.59916667 4.53166667 ... 4.405 5.14916667 4.78916667]
[4.60166667 4.29583333 4.21833333 ... 4.09833333 4.78916667 4.4625 ]]
答案 0 :(得分:0)
print(np.cov(iris_separated [0],rowvar = False))解决了这个问题,对数据使用.T也解决了
答案 1 :(得分:0)
您需要转置矩阵。每列代表一个观察值,每行代表一个变量。因此,它应该是np.cov(iris_seperated[0].T)
。
请参考文档
https://docs.scipy.org/doc/numpy/reference/generated/numpy.cov.html