我正在研究为电信公司开发推荐引擎的案例研究。目标是向新客户推荐合适的产品。我们计划遵循的逻辑是将他的个人资料(如年龄,就业,性别等)与我们现有的客户数据库进行比较,以找到类似客户并推荐这些客户最常使用的产品。样本数据如下:
customerID gender SeniorCitizen Partner Dependents tenure PhoneService Contract Package
7590-VHVEG Female 0 Yes No 1 No Month-to-month Package1
5575-GNVDE Male 0 No No 34 Yes One year Package2
3668-QPYBK Male 0 No No 2 Yes Month-to-month Package1
我遇到了许多相似性测量技术,如余弦相似度,欧几里德距离,皮尔逊相关系数等,但不能归零于适合我情况的东西。
请您指导我如何入手?虽然我打算在R中这样做,但目前我还没有找到任何代码。