我有一个类似的框架:
x = sf.SFrame({'users': [{'123': 1.0, '122': 5},
{'134': 3.0, '123': 10}]})
我想在不调用graphlab create的情况下转换为scipy.sparse csr_matrix,但只使用sframe和Python。
怎么做?
答案 0 :(得分:0)
假设您希望行号为输出稀疏矩阵中的行索引,唯一棘手的步骤是使用SFrame.stack
- 从那里您应该能够直接构造csr_matrix
。
import sframe as sf
from scipy.sparse import csr_matrix
x = sf.SFrame({'users': [{'123': 1.0, '122': 5},
{'134': 3.0, '123': 10}]})
x = x.add_row_number('row_id')
x = x.stack('users')
A = csr_matrix((x['X3'], (x['row_id'], x['X2'])),
shape=(2, 135))
我也在这里对矩阵的维度进行硬编码,但这可能是你想要编程的东西。