我正在努力解决一个概念问题。 我有间隔[1800,1850]的正整数。 对于那个区间的每个整数,让我们说(不失一般性)1820,我有大约3000匹马。 1820年的数字是一匹马的出生年份。给马喂食传统食物,其中一些马用实验食物喂养(有29种不同的实验食物)。对于每匹马,记录了每个喂养的变量,称为打喷嚏的好处(善良变量越高越好)。让我们假设每次喂奶后都会打喷嚏。每次喂马(均匀分布)时,每匹马都可以喂食不同类型的食物。让我们假设马的打喷嚏来自Poisson分布,lamba = 1参数。
现在我正在寻找间隔最好的[1800,1850]间隔,如:
[1800,1810), [1810,1826), [1826,1850]
说:对于每个子区间,这种或那种实验性食物(或者在某些情况下可能是传统食物)给出了在该间隔内出生的马的最佳平均喷嚏。
我不知道是否需要它,但我们假设马不定期喂养。其中一些比其他人更频繁。实验花了20天。
如果有一种以相对快速的方式产生最佳间隔的好方法? 我试图在1到50之间为i做一个循环,其中我是一些[1800,1850]区间分区中心。
If i=1
I check:
[1800,1801],(1802,1850]
[1800,1802],(1803,1850]
...
[1800,1849],(1849,1850]
并检查哪个实验食物在该子区间内给出了最大的平均喷嚏,并以此为例回答问题:
[1800,1807], (1807,1850]
是分区的最佳分区,其中1个区间中心为[1800,1807]出生的马匹,最好的食物是实验食品25,而出生于(1807,1850)的马匹最好的食物是实验食品14。
对于传统食物,它们为马匹提供了0.04更高的平均喷嚏。 (0.04当然是两个区间内马匹数量的加权平均值)
然后我可以选择i = 2,依此类推,但是i越高,子区间的马越少,平均打喷嚏的估计值就越大。
所以我想选择最好的[1800,1850]师 a的加权平均值,其中a是从子区间计算得到的,并且如下公式:
$ a = \ phi(1- p)^ { - 1} \ times \ sqrt {Var(X)/ n_ {x} + Var(Y)/ n_ {y}} + \ mu_ {X} - \ mu_ {Y} $
其中$ X $是用实验食物处理的马的记录,在该子区间内给出最高的平均喷嚏,$ Y $是在该子区间内用传统食物处理的马的记录。 $ \ mu $是记录的平均值,$ Var $是差异,p是$ P的概率(\ mu_ {X} - \ mu_ {Y}> a)= p $(我假设$ \ mu_ {X} $具有正态分布),$ \ phi $是标准正态分布函数,n是记录数。有人对这个问题有相对快速的算法吗? 如果问题不明确,请告诉我要说明的内容。