fit_transform包含训练数据并通过测试进行转换

时间:2016-10-12 15:14:50

标签: python scikit-learn

正如标题所说,我在培训数据上使用fit_transformCountVectorizer ..然后我只使用tranform测试数据...这会给出我和仅在培训时使用fit和仅在测试数据上使用tranform一样吗?

2 个答案:

答案 0 :(得分:5)

答案是

fit_transform相当于fit后跟transform,但效率更高。 See documentation

fitfit_transform都适合您的分类器到您的数据集。然后,您可以使用相同的分类器来转换任何其他数据集(在您的情况下是测试集)。

答案 1 :(得分:0)

如果您仅在培训上使用fit而在测试数据上使用transform,则无法获得正确的结果。

在训练数据上使用fit_transform时,意味着机器正在学习特征空间中的参数,并且还可以转换(缩放)训练数据。另一方面,您应该只对测试数据使用transform来根据从训练数据中学习的参数进行缩放。

相关问题