每个标签的get_feature_names

时间:2019-05-10 02:11:53

标签: machine-learning tfidfvectorizer

我是机器学习的新手,从多层文本分类开始。我能够根据训练有素的模型对新数据进行分类。但是,有些标签没有预料到。

f 我想查看令牌的权重,或者可以将其称为用于L1和L2的功能。

例如,有两个标签L1和L2。新记录与L1相关联,但它们被预测为L2,这两个记录具有相似的标记,差异很小。

我的全部问题是,我能看到tfidfvectorizer映射到L1和L2的功能吗,如下所示,使用get_feature_names()和'Y'变量。

L1(曲棍球)-'球','地面','网','棒' L2(板球)-'球','地面','棍子','树桩'

0 个答案:

没有答案