需要合并一个稀疏矩阵和python中数据框的两列

时间:2020-06-25 18:14:52

标签: python sparse-matrix sentiment-analysis tf-idf

我的稀疏矩阵为(881900,76656)。

Sprase matrix

Dataframe with column(highlighted) of interest

我的数据框和稀疏矩阵都没有相同的行,但是没有共同的列 稀疏矩阵是tf-idf情感分析过程的输出

如果我可以在python中合并这两个对象,请指导我,我想我应该确保数据帧中的每个条目都与稀疏矩阵的相应条目对齐。

1 个答案:

答案 0 :(得分:0)

您可以使用scipy sparse中的sparse.hstack函数将它们连接成一个稀疏矩阵。这是一个示例:

from scipy import sparse
import numpy as np, pandas as pd

s = sparse.csc_matrix(np.arange(6).reshape(2, 3))
df = pd.DataFrame(np.arange(4).reshape(2, 2))

display(s.toarray())
# array([[0, 1, 2],
#        [3, 4, 5]])
display(df.values)
# array([[0, 1],
#        [2, 3]])

combined = sparse.hstack([s, df])
display(combined.toarray())
# array([[0, 1, 2, 0, 1],
#        [3, 4, 5, 2, 3]])