我试图使用快速文本标记一些数据id Shape Color
1 round red
2 round blue
3 square red
4 square green
5 circle blue
6 circle red
7 circle green
8 something blue
9 something green
或[url]
只是为了对其进行测试
在每个标签的 6k 上进行训练后,一旦预测,它就会一直预测[PN]
训练命令
[PN]
样本训练数据
fasttext supervised -input input.txt -output model -minn 0 -maxn 0 -epoch 100 -lr 0.1
样本测试数据
__label__PN 5962-8904XA
__label__PN 585DD4P54ZP
__label__PN GQ0B11400FCT
__label__URL http://ws.com/qd/lat/ispls32883.pdf
__label__URL http://ws.com/pdfs//2004/0423/ds/m412b.pdf
__label__URL http://ws.com/pdfs//2004/0423/mc68.pdf
答案 0 :(得分:0)
FastText基于WordNGrams,这意味着您需要 完整的句子 作为算法的输入。
在您的示例中,您仅传递该算法的一个字母组合,并且取决于您在模型无法学习的参数中使用的WordNGrams
的数量。
ELI5:它的算法是:我能够学习复杂的句子,因为单词的结构及其组合,但是您只向我发送单词。我无法处理。