我的客户数据库具有某些属性和客户类型。属性集合可以变化(虽然它们确实来自有限集合),当我查看具有给定属性的未知类型的新客户时,我想确定他/她属于哪种类型。例如,假设我已经在DB中拥有这些客户,
Customer | Type | Attributes
1 A 44,32,5,'X'
2 A 3,32,66,'A'
3 B 6,32,'A', 'B'
4 C 47,31,2,'H'
5 C 14,32,2,'O'
6 C 2,'C'
7 A 44
当我收到具有属性的新客户时,例如3,32,2,我想确定该客户属于哪种类型,并且代码应报告此匹配的置信度(以百分比表示)。 / p>
这里使用的最佳方法是什么?统计的东西,或基于某种亲和力矩阵的方法,或基于推荐引擎风格的Pearson Correlation系数方法?样品,pseude代码将是最受欢迎的,但任何,所有的想法都很好。
谢谢,
答案 0 :(得分:0)
解决这个问题的方法是使用朴素贝叶斯。