我有一个保险公司的数据集,用于我的数据科学课程项目。我在该项目中的最终业务目标是向现有客户/客户群出售更多保单。
首先,我想通过具有 RFM 得分的k均值模型聚集我的客户,然后使用apriori算法在其中找到关联规则集群。以后,我可以找到可以销售更多产品的客户/客户群。但是我的老师希望我检验我的预测,并说,由于政策每年都重复执行,因此您不能将最近3个月的数据拆分为测试数据-设置,剩下的9个月是火车数据等。总而言之,他希望我以更准确的方式测试我的预测。在这种特定情况下,我该如何检验我的预测?
我的数据集包括有关客户的信息,例如年龄,收入,教育程度等。数量不多 <民主> 。由于我了解客户,因此我想使用RFM得分所有的购买记录。列包括他们购买的政策类型,购买时间,购买的公司,定价的定价。购买,他们在哪个地区购买,电话号码,地址,邮件地址等。
保险类型为人寿,汽车,交通,居住保险,火灾等。