如何计算python输出的均值,模式,方差,标准差等?

时间:2017-02-11 14:26:55

标签: python random simulation python-3.5 montecarlo

我有一个基于概率的简单游戏,每天我们掷硬币然后如果我们得到头,那么我们赢了,我们得到20美元,如果我们扔硬币然后我们得到尾巴然后我们输掉19美元,最后在这个月(28天),我们看到我们丢失或制造了多少。

def coin_tossing_game():
    random_numbers = [random.randint(0, 1) for x in range(500)] #generate 500 random numbers
    for x in random_numbers:
        if x == 0: #if we get heads
            return 20 #we win $20
        elif x == 1: #if we get tails
            return -19 #we lose $19


for a in range(1, 28): #for each day of the month
    print(coin_tossing_game())

这将返回输出20 20 -19 -19 -19 -19 -19 20 -19 20 -19 20 -19 20 20 -19 -19 20 20 -19 -19 -19 20 20 20 -19 -19 -19 20 20

这个输出正是我的预期。我想找到输出和其他描述性统计数据的总和,如平均值,模式,中位数,标准偏差,置信区间等。我不得不将这些数据复制并粘贴到Excel中进行此数据分析。我希望有一种方法可以很快在python中轻松完成。

3 个答案:

答案 0 :(得分:4)

您正在询问如何。最直接可用的是以统计信息库的形式构建到Python中。但同样,你似乎想知道如何做到这一点。以下代码显示了基础知识,我近50年来一直认为这是不必要的。

首先,修改代码,使其在向量中捕获样本。在我的代码中,它被称为sample

代码的第一部分只是练习Python库。没有汗水。

代码的第二部分显示了如何累积样本中的值的总和,以及它们与均值的偏差的平方和。我留给你研究如何在这些统计数据的通常假设下计算样本方差,样本标准差和置信区间。对样本进行排序和重命名后,我会计算最大值和最小值(对于某些分布的估计很有用)。最后,我从排序样本中计算出中位数。我把中位数计算给你。

import random

def coin_tossing_game():
    random_numbers = [random.randint(0, 1) for x in range(500)] #generate 500 random numbers
    for x in random_numbers:
        if x == 0: #if we get heads
            return 20 #we win $20
        elif x == 1: #if we get tails
            return -19 #we lose $19

sample = []
for a in range(1, 28): #for each day of the month
    #~ print(coin_tossing_game())
    sample.append(coin_tossing_game())

## the easy way

import statistics

print (statistics.mean(sample))
print (statistics.median(sample))
print (statistics.mode(sample))
print (statistics.stdev(sample))
print (statistics.variance(sample))

## the hard way

sample.sort()
orderedSample = sample
N = len(sample)
minSample = orderedSample[0]
maxSample = orderedSample[-1]
sumX = 0
for x in sample:
    sumX += x
mean = sumX / N

sumDeviates2 = 0
for x in sample:
    sumDeviates2 += ( x-mean )**2

k = N//2
if N%2==0:
    mode = 0.5* (orderedSample[k]+orderedSample[k-1])
else:
    mode = orderedSample[k]

答案 1 :(得分:1)

使用scipy stats模块并使用modal作为模式,使用scipy.stats.mstats.median_cihs作为中位数,并使用trim_mean作为均值。您还可以使用统计信息模块并使用mean()median()mode()函数。

答案 2 :(得分:1)

是的,有:安装numpy和scipy。使用函数numpy.meannumpy.stdnumpy.medianscipy.stats.mode

Scipy还包含scipy.stats模块,该模块提供各种常见的重要性测试。