翻转三面硬币

时间:2018-12-10 17:11:49

标签: statistics

关于人口统计,我有两个相关的问题。我不是统计学家,但希望您能了解更多信息。

我有一个过程是由于掷出三面硬币(结果:A,B,C)而产生的,并且我计算了统计量t=(A-C)/(A+B+C)。在我的问题中,我有一个将其随机分为X和Y的集合,可能统一地划分,也可能不是。我计算X和Y的t。我想知道我在这两个t值中观察到的差异是否可能是偶然的缘故。

现在,如果这是一个简单的二项式分布(即,我只是计算谁以X或Y结尾),我将知道该怎么做:我计算n=|X|+|Y|σ=sqrt(np(1-p))(并且假设我的p=.5),然后将其与正态分布进行比较。因此,举例来说,如果我观察到|X|=45|Y|=55,我会说σ=5,因此我希望平均数μ=50的这一变化有68.27%时间。另外,我希望平均时间有31.73%的偏差。

有一个中间问题,我也对此感兴趣,并且我认为这可以帮助我理解主要问题,即我测量A和B成员的某些属性。假设A度量为25%,B度量为66%正。 (A和B的基数不同-选择过程不统一。)我想知道是否偶然遇到这种差异。

作为初稿,我计算t就像在测量硬币翻转一样,但是我敢肯定这实际上是不正确的。

是否有任何关于这是正确建模方法的指针?

1 个答案:

答案 0 :(得分:0)

第一个问题
对于三面硬币问题,请看一下多项式分布。这是用于具有两个以上结果的“二项式”问题的分布。

以下是维基百科(https://en.wikipedia.org/wiki/Multinomial_distribution)的示例:

假设在一个大国进行的三向选举中,候选人A获得20%的选票,候选人B获得30%的选票,而候选人C获得50%的选票。如果随机选择六个选民,样本中将有多少位候选人A的支持者,候选人B的两个支持者和候选人C的三个支持者的概率是多少?

注意:由于我们假设投票人群很大,因此,一旦为样本选择了投票者,就可以认为概率是不变的。从技术上讲,这是无替换的抽样,因此正确的分布是多元超几何分布,但是随着人口的增长,分布会收敛。

formula for multinomial example


第二个问题
第二个问题似乎是交叉表的问题。然后使用“关联的卡方检验”来测试变量之间是否存在显着关联。并使用交叉表的“标准化残差”来确定哪些关联更有可能发生,哪些关联不太可能发生。