根据内容对客户问题进行分类

时间:2017-01-14 15:49:19

标签: machine-learning nlp classification supervised-learning

我正在开发用户可以提问的网络应用。这些问题应根据问题内容,​​标题,用户数据,地区等一些标准进行分类。接下来应该以这样的方式处理这些问题:对于一些其他信息请求应该被发送,其他应该被删除或标记为垃圾邮件,一些 - 直接发送给某个专家。

问题是用户无法自己选择正确的类别,这是非常复杂的事情,用户可以作弊。

有什么方法可以自动完成吗?现在有一些人做这个工作过滤问题。也许存在一些已经完成的解决方案。

1 个答案:

答案 0 :(得分:1)

这是一项非常复杂的任务。您应该看看有监督的机器学习分类算法。您可以尝试使用类似于某些垃圾邮件过滤算法(https://en.wikipedia.org/wiki/Naive_Bayes_spam_filtering

  1. 收集之前分类的一些问题(标记为示例)。
  2. 收集用于问题分类的一些单词(词汇)(识别组)。
  3. 处理问题文本,删除“停用词”并用词干替换词语。
  4. 将问题文本,标题,用户数据等映射到一些数字(问题向量)。
  5. 使用某些算法(如SVM)创建和使用分类器(模型)
  6. 但这就像你可以看到的非常通用的方法。没有额外的细节,很难说更具体的内容。我不认为你能找到已经完成的解决方案,这是非常具体的任务。但是因为你可以使用很多机器学习框架。