如何从现有样本数据中生成随机数据?

时间:2019-02-01 17:25:40

标签: python python-3.x random

我有一组现有数据,可以说:

sample_data = [2,2,2,2,2,2,3,3,3,3,4,4,4,4,4]

关闭此样品的数据,我想产生一组随机一定长度的数据。这不应该被关闭的采样数据的,但关闭时生成的样本数据的离分布的。

如果我想要5个随机点,则预期输出:

output_data = [3.4,2.3,1.5,5.2,1.3]

3 个答案:

答案 0 :(得分:2)

使用.amcharts-chart-div > a { display: none !important; }

random.sample

输出:

import random

sample_data = [2,2,2,2,2,2,3,3,3,3,4,4,4,4,4]
# if you want to select 5 samples from above data
print(random.sample(sample_data, 5))

答案 1 :(得分:1)

[3, 2, 2, 4, 2]

答案 2 :(得分:1)

有是问题的一个重要前提是,需要决定:样分布的你想要什么的?现在,作为人类,当我们有足够的数据时,我们可以按分布的形状对分布进行分类。不过机器不这样做,安装一个分布型,说制服或二项式到一个新的输入是任意的。这里,我将提供与统计量的黄金标准简要回答 - 正态分布(根据中心极限定理,足够大的样本大小收敛到正常)

import numpy as np

sample_data = [2,2,2,2,2,2,3,3,3,3,4,4,4,4,4]
size = 5
new_samples = np.random.normal(np.mean(sample_data), np.std(sample_data), size)

>>> new_samples
array([ 2.01221231,  2.62772975,  1.79965428,  3.83601719,  2.44967777])

通过正态分布生成新样本,该正态分布假定原始样本的均值和标准差。