假设我有一个具有以下结构的csv文件(800k条记录),并且我想确定产品组合的现有模式(例如,通常将产品XYZ放在一起的模式):
Customer_ID | Product_ID | Revenue
1 A X
1 B X
1 C X
2 A X
2 D X
3 A X
4 F X
从数据科学的角度来看,您将如何处理?您将使用哪些方法以及需要采取的步骤(例如,建议使用的方法的伪代码,最好是python)。
非常感谢您的帮助。高度赞赏! 问候 西蒙
答案 0 :(得分:0)
有一个标准的数据挖掘任务,称为
又名市场购物篮分析。
它查看经常一起购买的产品。
您真的应该先阅读一些基础书籍和Wikipedia ...