Question

我正在努力解决一个概念问题。我有间隔[1800,1850]的正整数。对于那个区间的每个整数，让我们说（不失一般性）1820，我有大约3000匹马。 1820年的数字是一匹马的出生年份。给马喂食传统食物，其中一些马用实验食物喂养（有29种不同的实验食物）。对于每匹马，记录了每个喂养的变量，称为打喷嚏的好处（善良变量越高越好）。让我们假设每次喂奶后都会打喷嚏。每次喂马（均匀分布）时，每匹马都可以喂食不同类型的食物。让我们假设马的打喷嚏来自Poisson分布，lamba = 1参数。

现在我正在寻找间隔最好的[1800,1850]间隔，如：

[1800,1810), [1810,1826), [1826,1850]

说：对于每个子区间，这种或那种实验性食物（或者在某些情况下可能是传统食物）给出了在该间隔内出生的马的最佳平均喷嚏。

我不知道是否需要它，但我们假设马不定期喂养。其中一些比其他人更频繁。实验花了20天。

如果有一种以相对快速的方式产生最佳间隔的好方法？我试图在1到50之间为i做一个循环，其中我是一些[1800,1850]区间分区中心。

If i=1
I check:
[1800,1801],(1802,1850] 
[1800,1802],(1803,1850] 
...
[1800,1849],(1849,1850]

并检查哪个实验食物在该子区间内给出了最大的平均喷嚏，并以此为例回答问题：

[1800,1807], (1807,1850]

是分区的最佳分区，其中1个区间中心为[1800,1807]出生的马匹，最好的食物是实验食品25，而出生于（1807,1850）的马匹最好的食物是实验食品14。

对于传统食物，它们为马匹提供了0.04更高的平均喷嚏。（0.04当然是两个区间内马匹数量的加权平均值）

然后我可以选择i = 2，依此类推，但是i越高，子区间的马越少，平均打喷嚏的估计值就越大。

所以我想选择最好的[1800,1850]师 a的加权平均值，其中a是从子区间计算得到的，并且如下公式：

$ a = \ phi（1- p）^ { - 1} \ times \ sqrt {Var（X）/ n_ {x} + Var（Y）/ n_ {y}} + \ mu_ {X} - \ mu_ {Y} $

其中$ X $是用实验食物处理的马的记录，在该子区间内给出最高的平均喷嚏，$ Y $是在该子区间内用传统食物处理的马的记录。 $ \ mu $是记录的平均值，$ Var $是差异，p是$ P的概率（\ mu_ {X} - \ mu_ {Y}＆gt; a）= p $（我假设$ \ mu_ {X} $具有正态分布），$ \ phi $是标准正态分布函数，n是记录数。

有人对这个问题有相对快速的算法吗？如果问题不明确，请告诉我要说明的内容。

有没有找到一些正整数区间的最佳划分的最佳方法？

0 个答案: