如何计算几个目标转换率的统计显着性?

时间:2011-11-23 21:26:40

标签: python ab-testing statistics

我正在进行python / django拆分测试或a / b测试库供我自己使用。但是我不知道如何计算我的测试是否具有统计学意义。我不了解统计数据,因此我无法理解大多数维基百科文章或关于此主题的网页,所以我正在寻找我的其他程序员的帮助。

我有一个简单的实验,有4个选项,我有一些使用它的用户数据。每个用户都在4个选项中的一个(为了参数,我们可以在控件上调用第一个)。每个用户要么成功要么失败,所以我知道每个选项的转换率。我如何判断我的测试是否具有统计学意义,或者它是否只是随机的。

基本上我的输入将是[ (a_yes, a_total), (b_yes, b_total), (c_yes, c_total), (d_yes, d_total)],并且很容易找出每个选项的转换率,即使每个选项与a相比有多好,但我如何计算它的统计显着性呢?可以知道这个测试是告诉我什么,或者我是否应该继续让它运行并收集更多数据。

当只有2个选项(传统的a / b测试)时,我看到了一些使用某些formulæ的指南,但我希望这个库能够处理多个选项。甚至可以用多个值计算统计显着性。

基本上,我正在尝试做类似于http://mixpanel.com/labs/split-test-calculator的事情,但是在python中。奖励点如果有一些python库我可以“pip install ...”

1 个答案:

答案 0 :(得分:3)

我相信你所需要的是一种卡方式的独立性测试。对于每种治疗,您有一个是计数而没有计数(total - yes)。该方法在here以及其他地方进行了描述。

Scipy有一项功能:http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.chi2_contingency.html#scipy.stats.chi2_contingency