应用错误收集

我需要训练与rasa的nlu一起使用的域字嵌入模型。我对可能的选择感到困惑。我不想使用预先训练的spacy嵌入，因为我想使用自己的语料库进行训练，但是似乎，如果您使用监督的嵌入（tensorflow ebeddings），则必须使用包含意图和目标的训练数据进行训练。训练短语：

“我们新的嵌入管道不使用预先训练的向量，而是同时学习意图和单词的嵌入。”

据我了解，此培训数据必须具有以下格式，您可以在其中指定意图及其培训短语：

意图：反馈

如果我想使用纯文本语料库训练嵌入怎么办？我是否需要单独进行操作，然后用他们的短语训练意图？这是如何与预训练的嵌入一起工作的吗？

任何建议将不胜感激。