我正在处理广告的点击情况,还是不在网站分类数据集中(相当平衡的一个)。我需要知道用于对网站访问者是否点击广告进行分类的正确概率阈值。
目标:-由于广告在网站上价格昂贵,因此我们希望确保仅向那些很有可能进行转化的用户展示广告,而不必要的点击只会大大增加我们的费用。
因此,现在我必须选择一种阈值,以使我们拥有大量的转化次数,并且广告点击率较低,并且无法转化。
我进行了逻辑回归(1 =点击0 =未点击),并且所附图片包含accuracy
,recall
,precision
,auc score
,{{1 }}的阈值分别为0.4、0.45、0.5、0.55、0.6。
据我所知,应该在最大f1_score处选择阈值。但是,由于我们希望最大限度地减少无法转化的广告点击,因此我们希望具有较高的精度,即尽可能减少误报率。
对于此数据集,f1分数在阈值= 0.45时为最高,但是在阈值= 0.55&0.6时精度更高。给定我们提到的目标,我应该选择哪个阈值?
试图寻找确定正确阈值的答案,但发现没有一个非常令人满意的。搜索stackoverflow和web。
f1_score
正确的阈值