我已经创建了一个参照rasa博客的员工姓名文本文件的查找表(下面的链接)。
Improving entity extractions with Rasa
现在,我的用例还要求我在查找表中为这些员工提供同义词。例如,“尼古拉斯”也可以称为“尼克”或“尼克”,这样拉萨机器人可以将“尼克”提取为“尼古拉斯”并满足用例。
请建议如何实现。
谢谢
答案 0 :(得分:0)
查找和同义词具有不同的用途,而查找用于实体提取,同义词用作将任何同义词的格式更改为原始文本的过滤方法。因此,我认为,查询表中不能包含同义词,因此您可能必须单独进行操作。
但是,如果同义词列表很长,则可以使用文件路径代替list。
## synonym:Nick
data/path/nick.txt
在通过查找使用“城市名称”时,我对城市名称及其昵称也有类似的情况,但是将它们的同义词放置在主数据文件中为
## synonym:New York City
- NY
- NYC
- New York
## lookup:city
data/lookups/city_lookup.txt
我建议使用https://github.com/rodrigopivi/Chatito,因为它具有一个非常好的映射系统,可以在同义词和查找方面为您完成工作,因此确实可以简化您的工作。