无监督学习API的训练数据

时间:2020-06-14 05:28:38

标签: fasttext

我正在尝试使用“ crawl-300d-2M.vec”预训练模型来为我的项目聚类文档。我不确定使用

时的训练数据(train.txt)应该是哪种格式

ft_model = fasttext.train_unsupervised(input='train.txt',pretrainedVectors=path, dim=300)

我的语料库包含1万个文档。我所做的就是将它们全部放在一个文本文件中,并将其提供给train_unsupervised方法。我没有得到好的结果。有人可以解释我所缺少的吗?谢谢。

0 个答案:

没有答案