我有100万行,例如:
customer_id product_id_viewed 12345 [756436,369955,1244356,4689667]
我希望根据客户查看模式的汇总将通常一起查看的产品分为单独的群集。我该怎么办?
我已采取的另一步骤是将这些数据加载到Elasticsearch中,并使用我的product_id的每一个对客户视图执行ificant_terms查询。然后,我为每一个最有可能一起查看的产品取回10个产品,以及一个得分。我的最终愿望是能够以描述不同“个性”类型或兴趣的方式对产品数据进行聚类。
像neo4j这样的图形数据库是否可以在这里或其他一些聚类算法中提供帮助?
答案 0 :(得分:0)
聚类是错误的方法。
没有理由假定这些模式是不相交的,并且完全分开是合适的。
取而代之的是购物篮分析,也就是频繁项集挖掘。