我有一组实际的数据,其中变量正负都严重偏斜。
我需要为以后的值生成随机样本数据。变量的数据需要类似地倾斜,以使协方差和相关性保持合理相似。
我计划使用numpy.random.multivariate_normal(),因为我可以轻松确定数据集的均值和协方差值。但是,由于数据偏斜,因此不正常。
使用numpy或sklearn,是否有一个随机数软件包可以产生相似的偏斜数据?
如果有人感兴趣,偏度如下:
rain 2.373325
temp -0.286573
rhum -0.289834
sun 1.103147
vis -0.303844