我有一个包含m行和数组作为值的数组,这些数组指示列的索引,并以大数n为界。 例如:
Y = [[1,34,203,2032],...,[2984]]
现在我想要一种有效的方法来初始化一个稀疏的numpy矩阵X,它的维数为m,n,其值对应于Y(如果j在Y [i]中,则X [i,j] = 1,否则为0)。
答案 0 :(得分:1)
您的数据已经接近csr格式,因此我建议使用:
import numpy as np
from scipy import sparse
from itertools import chain
# create an example
m, n = 20, 10
X = np.random.random((m, n)) < 0.1
Y = [list(np.where(y)[0]) for y in X]
# construct the sparse matrix
indptr = np.fromiter(chain((0,), map(len, Y)), int, len(Y) + 1).cumsum()
indices = np.fromiter(chain.from_iterable(Y), int, indptr[-1])
data = np.ones_like(indices)
S = sparse.csr_matrix((data, indices, indptr), (m, n))
# or
S = sparse.csr_matrix((data, indices, indptr))
# check
assert np.all(S==X)