我正在寻找一种使用Pandas测试正态分布的便捷方法。
Stata有一个有用的helper function阶梯/高手,可以计算或绘制几个变换。
我知道R具有'HH'包中包含的类似功能。
我想知道是否有办法用Pandas / Python实现类似的功能?
非常感谢!
答案 0 :(得分:2)
<强>设置强>
<article class="row single-post mt-5 no-gutters">
<div class="image-wrapper col-md-6">
<?php the_post_thumbnail(); ?>
</div>
<div class="single-post-content-wrapper p-3">
<?php the_content(); ?>
</div>
</article>
使用np.random.seed(0)
df = pd.DataFrame(np.random.normal(0, 1.5, (100, 1)), columns=['data'])
功能:
scipy.stats.normaltest
该函数测试数据来自正态分布的零假设。 from scipy.stats import normaltest
k2, p = normaltest(df.data)
p
0.796799418250495
的值越高,数据来自正态分布的概率越高。应用一个阈值(通常为0.05),超过该阈值就不能拒绝零假设。