我需要训练与rasa的nlu一起使用的域字嵌入模型。我对可能的选择感到困惑。我不想使用预先训练的spacy嵌入,因为我想使用自己的语料库进行训练,但是似乎,如果您使用监督的嵌入(tensorflow ebeddings),则必须使用包含意图和目标的训练数据进行训练。训练短语:
“我们新的嵌入管道不使用预先训练的向量,而是同时学习意图和单词的嵌入。”
(https://medium.com/rasa-blog/supervised-word-vectors-from-scratch-in-rasa-nlu-6daf794efcd8)
据我了解,此培训数据必须具有以下格式,您可以在其中指定意图及其培训短语:
如果我想使用纯文本语料库训练嵌入怎么办?我是否需要单独进行操作,然后用他们的短语训练意图?这是如何与预训练的嵌入一起工作的吗?
任何建议将不胜感激。