我正在尝试将一些真实数据解析为.mat
对象,以便加载到我的matlab脚本中。
我收到此错误:
TypeError:' coo_matrix'对象不支持项目分配
我找到了coo_matrix。但是,我无法为其分配值。
data.txt中
10 45
11 12
4 1
我想得到一个大小 100x100 的稀疏矩阵。并将1分配给
Mat(10, 45) = 1
Mat(11, 12) = 1
Mat(4, 1) = 1
CODE
import numpy as np
from scipy.sparse import coo_matrix
def pdata(pathToFile):
M = coo_matrix(100, 100)
with open(pathToFile) as f:
for line in f:
s = line.split()
x, y = [int(v) for v in s]
M[x, y] = 1
return M
if __name__ == "__main__":
M = pdata('small.txt')
有什么建议吗?
答案 0 :(得分:5)
使用支持高效索引的稀疏格式,例如dok_matrix
这是一种用于逐步构造稀疏矩阵的有效结构。
...
允许对单个元素进行有效的O(1)访问。不允许重复。一旦构建,就可以有效地转换为coo_matrix。
最后一句可以推广为:如果需要,可以有效地转换为所有其他常见格式。
from scipy.sparse import dok_matrix
M = dok_matrix((100, 100)) # extra brackets needed as mentioned in comments
# thanks Daniel!
M[0,3] = 5
答案 1 :(得分:2)
使用{data,(rows,cols))`参数格式用coo_matrix
构造此矩阵:
In [2]: from scipy import sparse
In [3]: from scipy import io
In [4]: data=np.array([[10,45],[11,12],[4,1]])
In [5]: data
Out[5]:
array([[10, 45],
[11, 12],
[ 4, 1]])
In [6]: rows = data[:,0]
In [7]: cols = data[:,1]
In [8]: data = np.ones(rows.shape, dtype=int)
In [9]: M = sparse.coo_matrix((data, (rows, cols)), shape=(100,100))
In [10]: M
Out[10]:
<100x100 sparse matrix of type '<class 'numpy.int32'>'
with 3 stored elements in COOrdinate format>
In [11]: print(M)
(10, 45) 1
(11, 12) 1
(4, 1) 1
如果将其保存为.mat文件以便在MATLAB中使用,它将以csc
格式保存(已将其从coo
转换):
In [13]: io.savemat('test.mat',{'M':M})
In [14]: d = io.loadmat('test.mat')
In [15]: d
Out[15]:
{'M': <100x100 sparse matrix of type '<class 'numpy.int32'>'
with 3 stored elements in Compressed Sparse Column format>,
'__globals__': [],
'__header__': b'MATLAB 5.0 MAT-file Platform: posix, Created on: Mon Aug 7 08:45:12 2017',
'__version__': '1.0'}
coo
格式未实现项目分配。 csr
和csc
确实会实施,但会抱怨。但它们是计算的常规格式。 lil
和dok
是迭代分配的最佳格式。