我正致力于将客户聊天消息分为5类。类别的示例是 - 登录,SSL等。对于实例,如果客户遇到登录问题,该消息可能会显示如下内容 - 我遇到登录问题或登录无效......我们必须考虑到拼写错误,提到多个分类关键词(例如:我刚刚升级了我的SSL,但现在我遇到了登录问题)等。
我可以使用模型/ apis来解决这个问题吗?
答案 0 :(得分:0)
我认为你的问题相当广泛,因为你的问题主要是关于文本分类,而且在大多数NLP分类算法中都面临过文献,所以有更多的选择(也许在你的情况下更好)而不是深学习。但是如果你想使用深度学习,你不仅需要考虑架构(简单的多层,卷积,LSTM等),还需要考虑良好训练所需的标记数据量(以及用于文本分类的无监督算法? )。
然后,独立于您决定的方法,我强烈建议您检查字嵌入算法(使用您自己的数据预训练或构建),特别是那些与fasttext类似的算法,因为它会让您deal with misspelling words。
我希望这会有所帮助