如何以越来越多的方式获得累积的数据量度

时间:2014-07-19 21:22:43

标签: graph plot statistics probability

我有一个包含两列的数据,如下面的

Column_1,Column_2

1,0.474124203822

2,0.545760430686

3,0.614420062696

4,0.654518950437

5,0.669226415094

6,0.6875

为简单起见,您可以将数据视为 Column_2 =(X = column_1)时的成功概率 这种关系有所增加。现在,如果我只是将数据绘制为最多30个点作为折线图,我将获得以下

现在,我的问题是如何以累积的方式绘制我的数据(使用什么度量),如下面的简单示例

col_1(年龄),col_2(总累计人数< =年龄)

10,200

20,1000

30,5000

如果我的说明不够明确或您有其他问题,请告诉我。

1 个答案:

答案 0 :(得分:0)

给定概率质量函数,您可以如下计算累积质量函数。

// Probability mass function
pmf = [0.1, 0.3, 0.2, 0.1, 0.3]

// Cumulative mass function
cmf = [0, 0, 0, 0, 0]

cmf[0] = pmf[0]
for i = 1, 2, 3, 4
    cmf[i] = cmf[i - 1] + pmf[i]

现在只需绘制累积质量函数而不是概率质量函数。