如何在Fasttext监督分类模型中为每个标签获取最重要的标记?

时间:2020-06-29 13:29:54

标签: python fasttext

我已经使用.train_supervised()训练了Fasttext模型,却无法根据模型为每个标签获取最重要的单词。

我有三个标签,所以我希望能够做类似的事情

model.label["__label__1"].get_most_significant()

关于如何实现这一目标的任何建议?

1 个答案:

答案 0 :(得分:1)

我在原始的FastText代码中没有注意到任何此类功能,因此也不会在Python包装器中看到它。

通过该过程,您也许可以隐约地得到想要的东西:

  • 对于每个单词,对一个单词文本的前k个标签进行概率预测– k可能与所有标签的数量一样
  • 从每个此类标签预测中,将带有标签概率的单词添加到该标签的日志中
  • 为每个标签记录日志,将出现概率最高的单词排在首位;将n的最高结果作为最能表明该标签的单词