多臂匪(CMAB)与“尝试和统计”组合有什么区别?

时间:2018-12-11 13:03:19

标签: recommendation-engine reinforcement-learning

多臂匪(CMAB)和“尝试和统计”之间的区别是什么?

根据我的理解,我认为CMAB策略是相同的,它会保留一部分网络流量以利用不同的选择,然后统计并修复原始分布...

有人可以告诉我区别吗?

1 个答案:

答案 0 :(得分:0)

我对此有所了解。

CMAB是一种算法,可以保证在有限的遗憾中找到结果。