我是机器学习的新手,从多层文本分类开始。我能够根据训练有素的模型对新数据进行分类。但是,有些标签没有预料到。
f 我想查看令牌的权重,或者可以将其称为用于L1和L2的功能。
例如,有两个标签L1和L2。新记录与L1相关联,但它们被预测为L2,这两个记录具有相似的标记,差异很小。我的全部问题是,我能看到tfidfvectorizer映射到L1和L2的功能吗,如下所示,使用get_feature_names()和'Y'变量。
L1(曲棍球)-'球','地面','网','棒' L2(板球)-'球','地面','棍子','树桩'