我正在用rasa-nlu构建一个聊天机器人。我完成了教程,并构建了一个简单的机器人。但是,我需要大量的培训数据来构建能够预订出租车的聊天机器人。所以我需要数据来构建一个特定的机器人。
是否有预订出租车的存储库或语料库? 或者有没有办法生成这种数据集?
答案 0 :(得分:3)
这是来自Rasa的创始人之一的博客文章,我认为它有一些非常好的建议。我认为你以错误的方式去寻求预先建立的训练集。自己启动,然后添加朋友等,直到您构建了最适合您机器人的训练集。
除此之外,Rasa文档在improving model performance
下有此内容当rasa_nlu服务器运行时,它会跟踪所有内容 它的预测并将它们保存到日志文件中。默认情况下为log 文件放在日志/中。此目录中的文件包含一个 每行json对象。您可以修复任何不正确的预测并添加 他们到你的训练集来改进你的解析器。
我认为只要你能够自己提出的训练集,你会感到惊讶。
找到语料库好运,但无论哪种方式都希望这些链接和片段有所帮助。
答案 1 :(得分:2)
以下链接包含与商业聊天机器人应用程序相关的数据集('人机对话)。它是人 - 人和人机文本对话数据集以及音频对话数据集的相当全面的集合。 https://breakend.github.io/DialogDatasets/
答案 2 :(得分:2)
我们确实遇到了相同的问题while trying to build a love relationship coach bot。长话短说,我们决定创建一个简单的工具来收集来自我们的朋友,同事或Mechanical Turk上的人的数据:https://chatbotstrap.io。
想法是创建像这样的民意调查:https://chatbotstrap.io/en/project/q5pimyskbhna2rm?language=en&nb_scenarios=10 并将它们发送给您认识的任何人。使用该解决方案,我们能够在几天内建立一个包含6000多个句子,分为10个意图的数据集。
该工具是免费的,只要您同意使用它构建的数据集可以开源即可。如果您更愿意成为所收集数据的唯一受益者,他们还将获得付费计划。
答案 3 :(得分:1)
执行此操作的一种方法是,转到LUIS.AI
使用Office 365登录,制作您自己的出租车预订应用程序,通过提供如下的意图和话语:
安装RASA NLU,我的机器上安装了Windows 8.1,步骤如下:
以下是配置RASA的步骤:
首次安装: 用于安装Python 3.6解释器的Anaconda 4.3.0 64位Windows:https://repo.continuum.io/archive/Anaconda3-4.3.0-Windows-x86_64.exe
&安培;
Visual Studio 2015的Python工具:https://ptvs.azureedge.net/download/PTVS%202.2.6%20VS%202015.msi
接下来,在命令提示符下以管理模式按此顺序安装以下软件包:
成功安装上述所有软件包后,制作一个将由RASA读取的spaCy配置文件,如下所示:
{
"project": "Travel",
"pipeline": "spacy_sklearn",
"language": "en",
"num_threads": 1,
"max_training_processes": 1,
"path": "C:\\Users\\Kunal\\Desktop\\RASA\\models",
"response_log": "C:\\Users\\Kunal\\Desktop\\RASA\\log",
"config": "C:\\Users\\Kunal\\Desktop\\RASA\\config_spacy.json",
"log_level": "INFO",
"port": 5000,
"data": "C:\\Users\\Kunal\\Desktop\\RASA\\data\\FlightBotFinal.json",
"emulate": "luis",
"spacy_model_name": "en",
"token": null,
"cors_origins": ["*"],
"aws_endpoint_url": null
}
接下来,制作如下目录结构:
数据文件夹 - >将包含所有LUIS格式的语料库
模型 - >将包含所有训练模型
日志 - >将包含活动学习日志和RASA框架日志
像这样,
现在,为训练和启动RASA NLU服务器制作批处理文件脚本。
通过记事本或Visual Studio代码创建一个TrainRASA.bat并写下:
python -m rasa_nlu.train -c config_spacy.json
pause
现在通过记事本或Visual Studio代码创建一个StartRASA.bat并写下:
python -m rasa_nlu.server -c config_spacy.json
pause
现在,通过单击刚刚创建的批处理文件脚本来训练和启动RASA Server。
现在,一切准备就绪,只需启动chrome并向你的enpoint / parse发出HTTP GET请求
赞:http://localhost:5000/parse?q=& project =
您将获得与Bot Framework C#的LUISResult类相对应的JSON响应。
现在处理完毕后要执行的业务逻辑。
或者,您可以查看RASA Core,它主要是为此目的而构建的。
RASA Core, which uses machine learning to build dialogs instead of simple if-else statements.