我不确定这个问题是否适合Stack Overflow,但无论如何我都会尝试一下。 我有一些数据如下:
我还有另一组数据,我认为它遵循类似的分布,但我只知道总百分比(例如30%而不是17%。)任何人都可以建议算法来估算每个单独等级的%s新的总百分比和原始分布?
答案 0 :(得分:1)
你的问题不清楚。如果您想通过包含您获得的附加数据来估算新的总百分比,则必须具有与您的百分比相关联的数量,以便您可以创建一个有意义的加权平均值。
如果要确定新数据集的分布是否与历史数据不同,则有几个测试主要是对累积实际值与预期值之间的特定值进行钝化计算。关于这个主题的文献有很多关于比较两个种群的分布的文献。
对于配对样本Wilcoxon-Rank是一种标准方法,如果您不能对数据的分布做出任何假设。对于非配对数据non-parametric statistics存在,但它们需要深入研究。
答案 1 :(得分:1)
步骤1:如果您的总体百分比为17%→30%则实际(总计)105→~189。
第2步:此数字需要分布在实际列
中的所有元素上从这里开始变得非线性,我们需要一些公式来从POssible到达Actual。这需要是总数的函数。
即功能(可能,总(实际))=实际。
如果我们能够达到上述目标,那么它可能会起作用;)
答案 2 :(得分:0)
如果您的新总数为x,则为第1层放置(22/627)* x,为第1层放置(21/627)* x,这将为您提供与之前相同的百分比1.然后为其他层做同样的事情(第二层可能是(45/627)* x等)。