如何为严重偏斜的样本生成随机数据

时间:2019-12-10 16:37:10

标签: python numpy scikit-learn

我有一组实际的数据,其中变量正负都严重偏斜。

我需要为以后的值生成随机样本数据。变量的数据需要类似地倾斜,以使协方差和相关性保持合理相似。

我计划使用numpy.random.multivariate_normal(),因为我可以轻松确定数据集的均值和协方差值。但是,由于数据偏斜,因此不正常。

使用numpy或sklearn,是否有一个随机数软件包可以产生相似的偏斜数据?

如果有人感兴趣,偏度如下:

 rain    2.373325

 temp   -0.286573

 rhum   -0.289834

 sun     1.103147

 vis    -0.303844

0 个答案:

没有答案