应用错误收集

时间：2014-03-04 10:37:13

标签： r ab-testing bandit

最近，我读过一篇名为Bandits Know the Best Product Price的博客文章（http://pkghosh.wordpress.com/2013/08/25/bandits-know-the-best-product-price/），概述了如何使用多臂强盗分析进行价格优化。

关于多臂强盗分析是否优于A / B测试（例如“每次都会击败A / B测试的20行代码”，还有很多讨论：http://stevehanov.ca/blog/index.php?id=132?utm_medium=referral与“为什么多臂强盗算法并不比A / B测试“更好”：http://visualwebsiteoptimizer.com/split-testing-blog/multi-armed-bandit-algorithm/）。

我知道有一个叫做“强盗”的R包，它可以用于这样的分析。

某人是否有玩具示例与博文中的相似 - 其中显示了如何通过使用R来应用此方法（在价格优化的背景下 ）？

感谢您的帮助。

答案 0 :(得分：3)

我最近正在做一个关于强盗算法的项目。基本上，强盗算法的性能由数据集决定。对于使用搅拌数据进行连续测试非常有用。那么你需要做些什么来测试和调整你的模型测试数据。

对于更多的土匪，你可以阅读本书，网站优化的强盗算法：http://shop.oreilly.com/product/0636920027393.do。它很好地解释了基本的强盗算法，并在Python中实现。您可以在Github中找到它的代码：https://github.com/johnmyleswhite/BanditsBook。然而，他们没有谈论书中的语境匪徒。

对于R，我不太确定。但我刚刚在网上搜索过，我发现一个人在R中实现了土匪，这里是代码：https://github.com/lotze/bandit

希望它可以帮到你。

答案 1 :(得分：3)

答案 2 :(得分：0)

我了解您要求使用R编写代码，但是实现通常非常非常简单。我认为this可能是相关的。如果您将二进制数据替换为连续数据，则该算法将起作用，因为“奖励”仅是平均值。因此，请随意使用相同的数据（如价格）并替换（带有随机数的数据）。