sFrame进入scipy.sparse csr_matrix

时间:2016-01-26 01:54:37

标签: python sframe

我有一个类似的框架:

x = sf.SFrame({'users': [{'123': 1.0, '122': 5},
{'134': 3.0, '123': 10}]})

我想在不调用graphlab create的情况下转换为scipy.sparse csr_matrix,但只使用sframe和Python。

怎么做?

1 个答案:

答案 0 :(得分:0)

假设您希望行号为输出稀疏矩阵中的行索引,唯一棘手的步骤是使用SFrame.stack - 从那里您应该能够直接构造csr_matrix

import sframe as sf
from scipy.sparse import csr_matrix

x = sf.SFrame({'users': [{'123': 1.0, '122': 5},
                         {'134': 3.0, '123': 10}]})
x = x.add_row_number('row_id')
x = x.stack('users')
A = csr_matrix((x['X3'], (x['row_id'], x['X2'])), 
               shape=(2, 135))

我也在这里对矩阵的维度进行硬编码,但这可能是你想要编程的东西。