fasttext不断预测一个标签

时间:2019-01-21 13:33:33

标签: text-classification fasttext

我试图使用快速文本标记一些数据id Shape Color 1 round red 2 round blue 3 square red 4 square green 5 circle blue 6 circle red 7 circle green 8 something blue 9 something green [url]只是为了对其进行测试 在每个标签的 6k 上进行训练后,一旦预测,它就会一直预测[PN]

训练命令

[PN]

样本训练数据

fasttext supervised -input input.txt -output model -minn 0 -maxn 0 -epoch 100 -lr 0.1

样本测试数据

__label__PN 5962-8904XA
__label__PN 585DD4P54ZP
__label__PN GQ0B11400FCT
__label__URL http://ws.com/qd/lat/ispls32883.pdf
__label__URL http://ws.com/pdfs//2004/0423/ds/m412b.pdf
__label__URL http://ws.com/pdfs//2004/0423/mc68.pdf

1 个答案:

答案 0 :(得分:0)

FastText基于WordNGrams,这意味着您需要 完整的句子 作为算法的输入。

在您的示例中,您仅传递该算法的一个字母组合,并且取决于您在模型无法学习的参数中使用的WordNGrams的数量。

ELI5:它的算法是:我能够学习复杂的句子,因为单词的结构及其组合,但是您只向我发送单词。我无法处理。