我正试图在客户上运行机器学习模型,试图将使用类似产品的客户分段。我的数据集庞大,有240万条记录,格式如下:
customer_id prod_1 prod_2 prod_3 prod_4 ..... prod_10
000 1 0 0 1 ..... 1
001 0 0 1 1 ..... 1
011 0 1 0 1 ..... 0
021 1 0 1 1 ..... 0
...
根据他们是否有产品,每行都有客户编号和1或0。我跑了k-means,结果看起来并不令人印象深刻。
有关哪些类型的模型可以在这些数据上运行以根据客户一起使用的产品对客户进行细分的任何其他建议?
答案 0 :(得分:2)
使用频繁项集挖掘。
放弃每个客户属于一个细分市场的想法。这在现实中并不成立。
相反,有典型的产品组合可识别细分。这些也可以重叠。一个客户可以同时兼顾电子设备和星球大战粉丝。