标签: deep-learning nlp text-processing n-gram fasttext
我正在尝试训练Fasttext模型,但是我不知道如何在训练数据中添加n-gram特征。 在论文或正式文档中,n-gram功能是否添加到培训文本的末尾?例如:
n-gram
1 2 3 4 5 (1,2) (2,3) (3,4) (4,5)
还是将原始数据替换为训练数据?
例如:
(1,2) (2,3) (3,4) (4,5)