让我们假设我是一家汉堡店的老板。每当客户从我的商店购买商品时,我都会记录日志,因此我拥有上个月出售的所有汉堡和奶昔的注册表。对我来说,一次制造20次奶昔比一次制造1次更容易,更便宜。所以这是我的目标:
我打算做的是在汉堡数据集中一行又一行地进行检查,并检查购买该汉堡的客户是否在1小时或更短时间内购买了奶昔。但这将是O(M ^ B),因为对于每个售出的汉堡,我都必须遍历奶昔数据集的所有行。有什么可能是更有效的方法?
这只是检查这两个产品之间是否存在任何关联的第一种方法。下一步将是一个更复杂的模型。
(M是奶昔表的行数,B是汉堡表的行数)