我正在努力解决以下问题:我有一些非常大的矩阵(比如,至少,2000x2000,可能在将来它们甚至会达到10000x10000),排名非常小(2或3,称之为N )我需要找到一个有效的Python例程来从中提取线性独立行(或列,矩阵是对称的!)。我试图采用QR分解的Q矩阵的前N列,但似乎不能正常工作(这可能是错误的吗?)。你有更好的主意吗?
非常感谢!
修改 这是我用来实现Ami Tavory建议的方法的Python代码:
from numpy import absolute
from numpy.linalg import qr
q = qr(R)[1] #R is my matrix
q = absolute(q)
sums = sum(q,axis=1)
i = 0
while( i < dim ): #dim is the matrix dimension
if(sums[i] > 1.e-10):
print "%d is a good index!" % i
i += 1
这应该告诉我行是否为非零,因此如果R的第i列是线性独立的。
答案 0 :(得分:6)
Gram Schmidt process使用线性组合找到基础(等效最大的独立子集),QR Decomposition有效地模仿了这一点。
因此,实现所需目标的一种方法是将numpy.linalg.qr
应用于转置,并检查 R 矩阵的非零分量。相应的列(在转置矩阵中,即原始矩阵中的行)是独立的。
修改经过一番搜索,我相信this Berkeley lecture会解释,但这里有例子
import numpy as np
# 2nd column is redundant
a = np.array([[1, 0, 0], [0, 0, 0], [1, 0, 1]])
>> np.linalg.qr(a)[1] # 2nd row empty
array([[ 1.41421356, 0. , 0.70710678],
[ 0. , 0. , 0. ],
[ 0. , 0. , 0.70710678]])
# 3rd column is redundant
a = np.array([[1, 0, 0], [1, 0, 1], [0, 0, 0], ])
>> np.linalg.qr(a)[1] # 3rd row empty
array([[ 1.41421356, 0. , 0.70710678],
[ 0. , 0. , -0.70710678],
[ 0. , 0. , 0. ]])
# No column redundant
a = np.array([[1, 0, 0], [1, 0, 1], [2, 3, 4], ])
>> np.linalg.qr(a)[1] # No row empty
array([[ 2.44948974, 2.44948974, 3.67423461],
[ 0. , 1.73205081, 1.73205081],
[ 0. , 0. , 0.70710678]])
答案 1 :(得分:-1)
这是我找到问题解决方案的链接!提出的Cauchy-Schwartz方法here效果很好!!