我的稀疏矩阵为(881900,76656)。
Dataframe with column(highlighted) of interest
我的数据框和稀疏矩阵都没有相同的行,但是没有共同的列 稀疏矩阵是tf-idf情感分析过程的输出
如果我可以在python中合并这两个对象,请指导我,我想我应该确保数据帧中的每个条目都与稀疏矩阵的相应条目对齐。
答案 0 :(得分:0)
您可以使用scipy sparse中的sparse.hstack
函数将它们连接成一个稀疏矩阵。这是一个示例:
from scipy import sparse
import numpy as np, pandas as pd
s = sparse.csc_matrix(np.arange(6).reshape(2, 3))
df = pd.DataFrame(np.arange(4).reshape(2, 2))
display(s.toarray())
# array([[0, 1, 2],
# [3, 4, 5]])
display(df.values)
# array([[0, 1],
# [2, 3]])
combined = sparse.hstack([s, df])
display(combined.toarray())
# array([[0, 1, 2, 0, 1],
# [3, 4, 5, 2, 3]])