我正在考虑使用有趣的发行版生成测试数据。
我理解生成均匀分布和正态分布的方法,但是如何将任意函数转换为加权分布函数?我的术语可能在这里 - 我不介意更正。
例如,假设我有一个随时间变化的函数,它通常会增加,但会定期循环。 “活动”一般在一年内增加,但每周周期在周末急剧下降。
该函数可以是代数,但如果它可以是任何函数(具有离散/不连续范围(?)的命令式(?))将是有价值的。
如果示例中的活动曲线为f(t)
,我可以将f(t)
设为均值并提供固定的标准偏差,但如果它也需要分配,我该如何选择t
?我不想迭代T
,我只想随意用适当的发行版选择T
。
因此,TestActivityGenerator()函数获取曲线之间的参数,例如绝对日期范围,几周内的另一条曲线,以及当天小时数的另一条曲线,并在适当的分布中吐出DateTimes。结果是不以任何特定顺序生成。
另一种情况可能是:实数生成器,例如,吐出素数的可能性是复合数的1.652倍。这个没有诀窍 - 有很简单的方法可以做到这一点,但我正在寻找一个通用的解决方案。
谢谢!
编辑:我改变了标题的措辞,从不同的角度看待问题 - 我们如何从最佳拟合曲线回溯到与该曲线一致的随机样本。如果我有股票市场数据的直方图,我怎样才能生成与真实数据类似的数据分布。不仅是每个t
平均值相同的成对值,因为它们会使其他随机性测试失败。