标签: fasttext
是否可以使用词袋示例来训练有效的,没有偏见的FastText模型?
我通过将单词串联成单个以空格分隔的字符串来准备每个单词袋,以供FastText使用(作为训练示例或分类模式)。单词的顺序是随机的。为了进行培训,我禁用了所有与单词顺序有关的FastText命令行选项:
-ws 0 -wordNgrams 1 -minn 0 -maxn 0
这会为词袋分类产生一个无偏模型吗?