我正在尝试理解sklearn.feature_extraction.text.TfidVectorizer,其拟合方法如下所述:
fit(raw_documents)了解从文档到数组的转换法 数据
不幸的是,我在网上搜索的所有定义似乎都没有关联。除非,它指的是保护法......但我不明白这是怎么回事。那么这个“转换法”指的是什么?
答案 0 :(得分:0)
转换法不是文本分析中的常用术语,这就是为什么这段描述在前一段时间内被改变的原因(真的是你的)。真正意味着fit
使变换器学习如何将文本文档转换为向量:它从输入文档以及术语中学习词汇。文件频率,用于tf-idf转换。