应用错误收集

线性判别分析无法处理稀疏矩阵

时间：2019-06-03 01:56:32

标签： scikit-learn

我有一个训练集，其中有80万行都是中文句子。我采用TfidfVectorize将句子转换为tf-idf稀疏矩阵。

由于稀疏矩阵的列太多，我想采用LDA进行分解。而且我发现LDA中的“适合”功能只能接受类似数组的输入。但是由于内存的限制，我无法将稀疏矩阵转换为数组。

您有什么建议吗？

0 个答案:

没有答案