使用自己的语料库训练rasa模型

时间:2019-06-19 13:55:18

标签: python word-embedding

我需要训练与rasa的nlu一起使用的域字嵌入模型。我对可能的选择感到困惑。我不想使用预先训练的spacy嵌入,因为我想使用自己的语料库进行训练,但是似乎,如果您使用监督的嵌入(tensorflow ebeddings),则必须使用包含意图和目标的训练数据进行训练。训练短语:

“我们新的嵌入管道不使用预先训练的向量,而是同时学习意图和单词的嵌入。”

https://medium.com/rasa-blog/supervised-word-vectors-from-scratch-in-rasa-nlu-6daf794efcd8

据我了解,此培训数据必须具有以下格式,您可以在其中指定意图及其培训短语:

意图:反馈

  • 这很有帮助
  • 我有与您交谈的最佳经验
  • 没有反馈

如果我想使用纯文本语料库训练嵌入怎么办?我是否需要单独进行操作,然后用他们的短语训练意图?这是如何与预训练的嵌入一起工作的吗?

任何建议将不胜感激。

0 个答案:

没有答案