我有2个表,其中一个有销售收入,会话数和渠道导致销售。另一张表从开始到用户上次访问网站都有所有流量,包括导致销售的流量。例如:
表1
userID | sale session | channel | revenue
--------------------------------------------------------
6652 7 EMAIL 52.00
6832 3 DIRECT 64.32
. . . .
. . . .
表2
userID | sessions | channel |
----------------------------------------------
6652 1 Paid Search
6652 2 Organic Search NB
6652 3 Organic Search NB
6652 4 Display RT
6652 5 SEA Search Brand
6652 6 EMAIL
6652 7 EMAIL
6652 8 DIRECT
我们使用归因模型在不同渠道之间分配收入。
如果我们只有一个频道(一个会话),那么100%的收入会转到该特定频道。
如果我们有两个频道(实际销售前只有一个频道),我们将收入分为两个频道。
如果我们有三个或更多频道,我们将第一个频道的40%,第二个频道的40%,以及其间的其余频道的20%合并。
最后,我们将所有收入除以渠道,以了解特定渠道对我们的总收入的影响程度。
在我们的示例中,“付费搜索”获得$ 52.00的40%,“EMAIL”获得40%,其余20%用于其他渠道(2/5用于“Organic Search NB”,1 / 5用于显示RT,1/5用于“SEA搜索品牌”,1/5用于“EMAIL”)。 第8届会议没有得到任何结果,因为它在销售完成时发生!
如果有人可以在SQL或任何其他类型的算法中为此提供解决方案,我将非常感激。