最近,我读过一篇名为Bandits Know the Best Product Price的博客文章 (http://pkghosh.wordpress.com/2013/08/25/bandits-know-the-best-product-price/),概述了如何使用多臂强盗分析进行价格优化。
关于多臂强盗分析是否优于A / B测试(例如“每次都会击败A / B测试的20行代码”,还有很多讨论:http://stevehanov.ca/blog/index.php?id=132?utm_medium=referral与“为什么多臂强盗算法并不比A / B测试“更好”:http://visualwebsiteoptimizer.com/split-testing-blog/multi-armed-bandit-algorithm/)。
我知道有一个叫做“强盗”的R包,它可以用于这样的分析。
某人是否有玩具示例与博文中的相似 - 其中显示了如何通过使用R来应用此方法(在价格优化的背景下 )?
感谢您的帮助。
答案 0 :(得分:3)
我最近正在做一个关于强盗算法的项目。基本上,强盗算法的性能由数据集决定。对于使用搅拌数据进行连续测试非常有用。那么你需要做些什么来测试和调整你的模型测试数据。
对于更多的土匪,你可以阅读本书,网站优化的强盗算法:http://shop.oreilly.com/product/0636920027393.do。它很好地解释了基本的强盗算法,并在Python中实现。您可以在Github中找到它的代码:https://github.com/johnmyleswhite/BanditsBook。然而,他们没有谈论书中的语境匪徒。
对于R,我不太确定。但我刚刚在网上搜索过,我发现一个人在R中实现了土匪,这里是代码:https://github.com/lotze/bandit
希望它可以帮到你。
答案 1 :(得分:3)
我对此主题的谨慎探索可能对您有用: http://codeandmath.wordpress.com/2014/04/05/type-i-error-in-bandits/
答案 2 :(得分:0)
我了解您要求使用R编写代码,但是实现通常非常非常简单。我认为this可能是相关的。如果您将二进制数据替换为连续数据,则该算法将起作用,因为“奖励”仅是平均值。因此,请随意使用相同的数据(如价格)并替换(带有随机数的数据)。