使用Facebook的库Fasttext进行标签识别

时间:2016-08-24 13:12:39

标签: python label

好的,所以我一直在玩Facebook最新的文本分类python库,而且我在标签识别方面有点挣扎。

如果我理解输入必须是txt文件中的行,则每行包含要素和标签。分类器可以通过它的前缀识别标签:" __ label __"。

但是出于某种原因,当我运行简单的测试代码时,我无法让分类器识别我的标签。这是:

import fasttext

classifier = fasttext.supervised('toto.txt', 'model')
print classifier.label_prefix
print classifier.labels
raise SystemExit(0)

在日志中给我这个结果:

__label__
[]

所以代码知道前缀是:" __ label __"但是无法在我的输入文件中捕获它们。关于为什么会发生这种情况的任何想法?

感谢您的帮助!

1 个答案:

答案 0 :(得分:1)

您需要显示“toto.txt”的内容才能获得一些帮助。

从我现在看到的情况来看,您提供的代码没有问题。

(顺便说一句,请确保您的toto.txt以'utf-8'编码,否则,您需要在分类器中设置编码参数)