我使用这种方法生成综合数据集:
import numpy as np
import random
def generate_dataset(size, dim):
dataset = [random.randint(0, 2 ** dim) for _ in range(size)]
# Removes duplicates
dataset = list(set(dataset))
return dataset
如您所见,数据点是根据[0 - 2^dim]
随机生成的。对于此方法生成的任何数据集,我都想添加噪声。现在,我正在考虑一种简单的方法,但是我不确定它在逻辑上是否正确,所以这里是:
这种产生声音的方式吗?
谢谢。
答案 0 :(得分:0)
似乎您正在创建异常值。对我来说,噪声更像是向数据点添加一个小数字(+/-数字)。例如,您今天走了几步?可能是100,但某些跟踪设备的读数可能是95或110。两者之间的差异就是噪音。
不确定这是否有帮助。