基于任意类别和相似度量的匹配

时间:2011-04-06 10:22:02

标签: search statistics data-mining similarity metric

我的客户数据库具有某些属性和客户类型。属性集合可以变化(虽然它们确实来自有限集合),当我查看具有给定属性的未知类型的新客户时,我想确定他/她属于哪种类型。例如,假设我已经在DB中拥有这些客户,

Customer | Type | Attributes

1           A      44,32,5,'X'
2           A      3,32,66,'A'
3           B      6,32,'A', 'B'           
4           C      47,31,2,'H'           
5           C      14,32,2,'O'  
6           C      2,'C'  
7           A      44

当我收到具有属性的新客户时,例如3,32,2,我想确定该客户属于哪种类型,并且代码应报告此匹配的置信度(以百分比表示)。 / p>

这里使用的最佳方法是什么?统计的东西,或基于某种亲和力矩阵的方法,或基于推荐引擎风格的Pearson Correlation系数方法?样品,pseude代码将是最受欢迎的,但任何,所有的想法都很好。

谢谢,

1 个答案:

答案 0 :(得分:0)

解决这个问题的方法是使用朴素贝叶斯。