我多次参加了三个A, B, C
行销活动。假设营销事件是独立的,并且每个事件都有自己的转化概率p_A,p_B,p_C。
campaigns = {
'A': 0.1, # name, conversion probability
'B': 0.2,
'C': 0.4,
}
某些用户已转换为付费帐户。
当每一行都是一个用户,而每一列是该用户接触过特定广告系列的次数时,我就有一个数据框。
A B C converted
0 3 1 0 True
1 0 0 1 False
2 3 1 1 True
3 1 3 2 False
4 1 0 0 False
在这种情况下,总转化概率为:
1 - (1 - p_A) ** A * (1 - p_B) ** B * (1 - p_C) ** C
估算原始p_A, p_B, p_C
的最佳方法是什么?
我正在寻找一些keras解决方案,但是我不确定如何设置自定义幂/指数层。我认为该模型应如下所示:
1 - (w_1 ** A) * (w_2 ** B) * (w_3 ** C) ~ predicted probability
但没有标准功能,喀拉拉邦也没有产品层。
Python代码生成完整示例:
import numpy as np
import pandas as pd
np.random.seed(4)
n = 1000
data = pd.DataFrame(np.zeros(n), columns=['prob'])
campaigns = {
'A': 0.1,
'B': 0.2,
'C': 0.4,
}
for campaign, conversion in campaigns.items():
data[campaign] = np.random.geometric(1 / (1 + .5), n) - 1
data['prob'] = 1 - (1 - data['prob']) * (1 - conversion) ** data[campaign]
data['converted'] = np.random.rand(n) < data['prob']
print(data.head())
prob A B C converted
0 0.416800 3 1 0 True
1 0.400000 0 0 1 False
2 0.650080 3 1 1 True
3 0.834112 1 3 2 False
4 0.100000 1 0 0 False
答案 0 :(得分:0)
from keras import backend as K
from keras.engine.topology import Layer
import numpy as np
from keras.backend import pow
class MyLayer(Layer):
def __init__(self, output_dim, **kwargs):
self.output_dim = output_dim
super(MyLayer, self).__init__(**kwargs)
def build(self, input_shape):
# Create a trainable weight variable for this layer.
self.kernel = self.add_weight(name='kernel',
shape=(input_shape[1], self.output_dim),
initializer='uniform',
trainable=True)
super(MyLayer, self).build(input_shape) # Be sure to call this at the end
def call(self, x):
A,B,C,w_1,w_2,w_3=x[0],x[1],x[2],self.kernel[0],self.kernel[1],self.kernel[2]
return (1-(pow(w_1, A))*(pow(w_2, B))*(pow(w_3, C)))
def compute_output_shape(self, input_shape):
return (input_shape[0], self.output_dim)
此层代表以下公式:
1 - (w_1 ** A) * (w_2 ** B) * (w_3 ** C) ~ predicted probability
https://keras.io/layers/writing-your-own-keras-layers/ 这是我使用的模板,唯一需要更改的就是调用函数。