代码

Question

我有numpy，statsmodel，pandas和scipy（我认为）

如何计算p值的z得分，反之亦然？

例如，如果我的p值为0.95，我应该得到1.96作为回报。

我在scipy中看到了一些函数，但它们只在数组上运行z-test。

Answer 1

>>> import scipy.stats as st
>>> st.norm.ppf(.95)
1.6448536269514722
>>> st.norm.cdf(1.64)
0.94949741652589625

正如其他用户所说，Python默认计算左/下尾概率。如果要确定包含95％分布的密度点，则必须采用另一种方法：

>>>st.norm.ppf(.975)
1.959963984540054
>>>st.norm.ppf(.025)
-1.960063984540054

Answer 2

从Python 3.8开始，标准库提供NormalDist对象作为statistics模块的一部分。

它可以用来获取zscore，法线曲线下x％的区域位于此from statistics import NormalDist NormalDist().inv_cdf((1 + 0.95) / 2.) # 1.9599639845400536 NormalDist().cdf(1.9599639845400536) * 2 - 1 # 0.95（忽略两条尾巴）。

使用标准正态分布上的inv_cdf（逆累积分布函数）和cdf（累积分布函数），我们可以从彼此获得反之亦然：

data = json.dumps(json_lines)

_{'（1 + 0.95）/ 2'的说明。公式可以在此wikipedia部分中找到。}

Answer 3

如果你对T-test感兴趣，可以做类似的：

z-statistics (z-score) 当数据服从正态分布，总体标准差 sigma 已知且样本量大于 30 时使用。Z-Score 告诉您有多少标准与您的结果的平均值的偏差。 z 分数使用以下公式计算：
z_score = (xbar - mu) / sigma
t-statistics (t-score)，也称为Student's T-Distribution，当数据服从正态分布时使用，总体标准差（sigma) NOT 已知，但样本标准差 (s) 已知或可计算，且样本量在 30 以下。T-分数告诉您结果与平均值的标准差有多少。 t 分数使用以下公式计算：
t_score = (xbar - mu) / (s/sqrt(n))

总结：如果样本量大于 30，则 z 分布和 t 分布几乎相同，可以使用任何一种。如果有总体标准差且样本量大于 30，则可以用总体标准差代替样本标准差使用 t 分布。

<头>

测试统计	查找表格	查找值	关键值	正常分布	人口标准偏差（sigma）	样本大小
z-statistics	z-table	z-score	z-critical 是特定置信水平下的 z-score	是	已知	> 30
t-statistics	t-table	t-score	t-critical 是特定置信水平的 t-score	是	未知	<30

Python 百分比函数用于计算特定置信度的临界值：

z-critical = stats.norm.ppf(1 - alpha) (use alpha = alpha/2 for two-sided)
t-critical = stats.t.ppf(alpha/numOfTails, ddof)

代码

import numpy as np
from scipy import stats


# alpha to critical
alpha = 0.05
n_sided = 2 # 2-sided test
z_crit = stats.norm.ppf(1-alpha/n_sided)
print(z_crit) # 1.959963984540054

# critical to alpha
alpha = stats.norm.sf(z_crit) * n_sided
print(alpha) # 0.05

在python中获得z得分的概率，反之亦然

3 个答案:

代码