上层知识界是如何工作的

时间:2019-08-15 10:36:36

标签: reinforcement-learning

我正在使用Ads CTR数据集。 链接:https://drive.google.com/file/d/1whkIInL4FKeHg2IfdcbT1j18L26fg9aF/view 我使用UCB(上限可信度)训练了模型,结果发现广告4大部分被点击了。 但是我在这里感到困惑。 我不能简单地从提供的数据集中计算出来吗? 我们如何将UCB应用于没有此数据集的现实问题中? 我们是否同时保持跟踪和更新我们的模型? 有人,请帮忙。

0 个答案:

没有答案