应用错误收集

我正在使用sklearn对文档进行分类。但是我在分割由TfidfTransformer生成的稀疏矩阵时遇到了麻烦，该稀疏矩阵包含列车和测试数据的语料库。

以下是我的代码的一部分：

vectorizer = CountVectorizer()
transformer = TfidfTransformer(norm="l2", use_idf=True, smooth_idf=True, sublinear_tf=True)
matrix = transformer.fit_transform(vectorizer.fit_transform(corpus))

这里corpus是列车数据和测试数据的直接组合（即读取列车数据，然后读取测试数据）我希望将matrix拆分为x_train和x_test。

train_test_split()无法使用，因为它是随机的但我只想拆分矩阵。

提前致谢。

如何在Scipy中拆分稀疏矩阵？

0 个答案: