为聊天机器人自定义语料库的最佳方法或最佳做法是什么?

时间:2019-07-19 17:48:00

标签: python chatbot training-data corpus chatterbot

我们一直在为需要创建请求和跟踪与服务相关的问题的用户创建一个聊天机器人。

我们一直在使用chatbot的智能进行一些测试,其中包含80万个寄存器数据,而且我正在使用多种不同的请求方式来创建和复制行。

有2种问题:

-由于在我们的语料库中具有相同答案的大量寄存器,我们得到的单个结果答案是完全错误的。

-假设我们的网络已经受过训练,那么要花很长时间才能得到答案。

from chatterbot import ChatBot
from chatterbot.trainers import ChatterBotCorpusTrainer
from chatterbot.trainers import ListTrainer

chat = ChatBot('luis')

# Create a new trainer for the chatbot
train = ChatterBotCorpusTrainer(chat)

# Train the chatbot based on the spanish corpus
# C:\Users\mcarvajalr\AppData\Local\Continuum\anaconda3\envs\Chatterbot\Lib\site-packages\chatterbot_corpus\data\spanish
train.train("chatterbot.corpus.spanish.trivia",
            "chatterbot.corpus.spanish.greetings",
            "chatterbot.corpus.spanish.DesbloqueoAD_rev03")

conversa = [
    "Quien es pacman",
    "Es una fantasma"
]

train = ListTrainer(chat)
train.train(conversa)

# Get a response to an input statement
chat.get_response("pacman ")
chat.get_response("desbloqueo cuenta")

0 个答案:

没有答案