知道向量是线性相关的,如何在Python中恢复丢失的矩阵值? 例如,在此示例中,第二个向量是前两个向量的两倍,而第三个向量是第二个向量的10倍(但实际上我们不知道这种依赖性)。
import numpy as np
nan = np.NaN
data = np.array([[1, nan, 5, 6, nan, 20],
[2, nan, nan, nan, 4, nan],
[20, nan, 100, 120, 40, nan]])
预期结果:第二列可能需要根据每个向量的分布进行替换(这样直观地呈现)
[[ 1. 7 5. 6. 2. 20.]
[ 2. 14 10. 12. 4. 40.]
[ 20. 140 100. 120. 40. 400.]]
可能有很多数据,向量之间的线性关系可能未像本例那样明确地表示出来,因此需要通用解决方案。
这需要:
1.找到相关系数 2.填空 2.插值剩余的空白。
告诉我该怎么做?