好的,所以我一直在玩Facebook最新的文本分类python库,而且我在标签识别方面有点挣扎。
如果我理解输入必须是txt文件中的行,则每行包含要素和标签。分类器可以通过它的前缀识别标签:" __ label __"。
但是出于某种原因,当我运行简单的测试代码时,我无法让分类器识别我的标签。这是:
import fasttext
classifier = fasttext.supervised('toto.txt', 'model')
print classifier.label_prefix
print classifier.labels
raise SystemExit(0)
在日志中给我这个结果:
__label__
[]
所以代码知道前缀是:" __ label __"但是无法在我的输入文件中捕获它们。关于为什么会发生这种情况的任何想法?
感谢您的帮助!
答案 0 :(得分:1)
您需要显示“toto.txt”的内容才能获得一些帮助。
从我现在看到的情况来看,您提供的代码没有问题。
(顺便说一句,请确保您的toto.txt以'utf-8'编码,否则,您需要在分类器中设置编码参数)