我想知道在某种程度上预处理用户输入是否有性能改进。例如,删除停用词,阻止短语,使句子变形等等......
我们一直在测试这项服务,有时它会在西班牙语(过去时,完成时等等)的不同时态出错,我们在测试集中测试并且没有经过培训和实际意图。测试的意图与实际训练的意图相同
I would like te get a card
I am trying to get a visa card
I am interested in mastercard
How can I get a credit card?
etc...
但是通过上面的训练,它会在句子中出错...#34;获得一张卡片会很有趣。
你们在训练或预处理任务方面有什么建议可以在未见过的例子中表现更好吗?