我有一些向量,其中有26个数据点,我想看看所述向量的分布是否为高斯分布。有没有我可以应用的功能或方法? 谢谢
答案 0 :(得分:0)
是的,这称为正常性测试。有一篇很棒的博客文章here将其检出。 这是一个名为Shapiro-Wilk的帖子的示例片段:
# Shapiro-Wilk Test
from numpy.random import seed
from numpy.random import randn
from scipy.stats import shapiro
# seed the random number generator
seed(1)
# generate univariate observations
data = 5 * randn(100) + 50
# normality test
stat, p = shapiro(data)
print('Statistics=%.3f, p=%.3f' % (stat, p))
# interpret
alpha = 0.05
if p > alpha:
print('Sample looks Gaussian (fail to reject H0)')
else:
print('Sample does not look Gaussian (reject H0)')
但是,没有检查n维数据的明确解决方案。您可以根据您的问题对每个特征进行测试,也可以对向量进行投影。