我正在尝试使用“ crawl-300d-2M.vec”预训练模型来为我的项目聚类文档。我不确定使用
时的训练数据(train.txt)应该是哪种格式 ft_model = fasttext.train_unsupervised(input='train.txt',pretrainedVectors=path, dim=300)
我的语料库包含1万个文档。我所做的就是将它们全部放在一个文本文件中,并将其提供给train_unsupervised方法。我没有得到好的结果。有人可以解释我所缺少的吗?谢谢。