我正在努力解决如何解决看似简单的问题,但我不能说服自己正确的方法。
我有时间序列数据,代表功率输出(P)的pdf,随时间变化,cdf和分位数函数 - f(P,t),F(P,t)和q(p, T)。我需要从这个数据中找到给定时间间隔[t1,t2]中能量的pdf,cdf和分位数函数 - 比如e(),E()和qe()。
显然能量是功率超过[t1,t2]的积分,但我如何最好地计算e,E和qe?
我最好的猜测是,由于q(p,t)是一个幂,我应该通过在时间间隔内积分q来生成qe,然后从中计算其他分布。
这样简单,还是我需要掌握随机微积分?
有关澄清的其他详细信息
我们获得的数据是每个时间t的f(P),F(P),q(P)的“黑盒”预测的时间序列,其中P是瞬时功率,并且将会我希望获得e(P)的间隔约100个预测值。通过'黑盒子'我的意思是我会调用一个函数来评估P的F,F,q,但我不知道底层分布。
黑盒功能几乎可以肯定地从产生功率预测的模型中插入输出数据,但是我们无法访问它。我猜它不会直截了当,因为它来自一系列非线性变换。这实际上是风电场的产量预测:风速可能是正常分布的,但多地形和涡轮机的变化会改变这种情况。
进一步澄清 (我已经编辑了原始文本,以消除能量分布函数中令人困惑的变量名称。)
预测将提供如下:
我们需要e,E和qe for的区间[t1,t2]被细分为100(比方说)子区间k = 1 ... 100。对于每个k,我们给出一个不同的f(P),称它们为f_k(P)。我们需要从这组f_k(P)计算区间的能量分布。
答案 0 :(得分:0)
感谢您的澄清。据我所知,你没有足够的信息来妥善解决这个问题。具体而言,您需要估计从一个时间步到下一个时间步的功率依赖性。时间步长越长,依赖性越小;如果步骤足够长,功率可能大致独立于一步到下一步,这将是一个好消息,因为这会简化分析。那么,时间步长多久?一小时?一分钟?一天?
如果时间步长足够独立,那么能量的分布就是100个变量的分布,这些变量将通过中心极限定理非常接近正态分布。在这种情况下,很容易计算总能量的均值和方差。
否则,分布将会是一些更复杂的结果。我的猜测是,通过独立步骤方法估计的方差将太大 - 我相信实际方差会略微减少。
根据你的说法,你没有任何关于时间依赖的信息。也许你可以从一些其他来源或源中找到或得出自相关函数的估计 - 如果已经针对风能研究了这个问题,我不会感到惊讶。如果已经研究过这个问题的一般版本,我也不会感到惊讶 - 也许你可以搜索类似于"分配一系列自相关变量的东西。"你可能会对stats.stackexchange.com上的那个问题感兴趣。