查找具有相似功能/产品组合的模式(最好在python中)

时间:2019-02-17 09:07:41

标签: python algorithm statistics cluster-analysis data-science

假设我有一个具有以下结构的csv文件(800k条记录),并且我想确定产品组合的现有模式(例如,通常将产品XYZ放在一起的模式):

Customer_ID | Product_ID | Revenue
    1             A          X
    1             B          X
    1             C          X
    2             A          X
    2             D          X
    3             A          X
    4             F          X

从数据科学的角度来看,您将如何处理?您将使用哪些方法以及需要采取的步骤(例如,建议使用的方法的伪代码,最好是python)。

非常感谢您的帮助。高度赞赏! 问候 西蒙

1 个答案:

答案 0 :(得分:0)

有一个标准的数据挖掘任务,称为

频繁挖掘项目集

又名市场购物篮分析。

它查看经常一起购买的产品。

您真的应该先阅读一些基础书籍和Wikipedia ...