我有一组现有数据,可以说:
sample_data = [2,2,2,2,2,2,3,3,3,3,4,4,4,4,4]
关闭此样品的数据,我想产生一组随机一定长度的数据。这不应该被关闭的采样数据的,但关闭时生成的样本数据的离分布的。
如果我想要5个随机点,则预期输出:
output_data = [3.4,2.3,1.5,5.2,1.3]
答案 0 :(得分:2)
使用.amcharts-chart-div > a {
display: none !important;
}
:
random.sample
输出:
import random
sample_data = [2,2,2,2,2,2,3,3,3,3,4,4,4,4,4]
# if you want to select 5 samples from above data
print(random.sample(sample_data, 5))
答案 1 :(得分:1)
[3, 2, 2, 4, 2]
答案 2 :(得分:1)
有是问题的一个重要前提是,需要决定:样分布的你想要什么的?现在,作为人类,当我们有足够的数据时,我们可以按分布的形状对分布进行分类。不过机器不这样做,安装一个分布型,说制服或二项式到一个新的输入是任意的。这里,我将提供与统计量的黄金标准简要回答 - 正态分布(根据中心极限定理,足够大的样本大小收敛到正常)
import numpy as np
sample_data = [2,2,2,2,2,2,3,3,3,3,4,4,4,4,4]
size = 5
new_samples = np.random.normal(np.mean(sample_data), np.std(sample_data), size)
>>> new_samples
array([ 2.01221231, 2.62772975, 1.79965428, 3.83601719, 2.44967777])
通过正态分布生成新样本,该正态分布假定原始样本的均值和标准差。