Question

我的客户数据库具有某些属性和客户类型。属性集合可以变化（虽然它们确实来自有限集合），当我查看具有给定属性的未知类型的新客户时，我想确定他/她属于哪种类型。例如，假设我已经在DB中拥有这些客户，

Customer | Type | Attributes

1           A      44,32,5,'X'
2           A      3,32,66,'A'
3           B      6,32,'A', 'B'           
4           C      47,31,2,'H'           
5           C      14,32,2,'O'  
6           C      2,'C'  
7           A      44

当我收到具有属性的新客户时，例如3,32,2，我想确定该客户属于哪种类型，并且代码应报告此匹配的置信度（以百分比表示）。 / p>

这里使用的最佳方法是什么？统计的东西，或基于某种亲和力矩阵的方法，或基于推荐引擎风格的Pearson Correlation系数方法？样品，pseude代码将是最受欢迎的，但任何，所有的想法都很好。

谢谢，

Answer 1

解决这个问题的方法是使用朴素贝叶斯。

基于任意类别和相似度量的匹配

1 个答案: