R:直方图上的分布总和的回归

时间:2013-11-05 10:20:23

标签: r kernel regression

情况如下:

我想将直方图描述为几种分布的总和,从而使这些分布适合该直方图。在ROOT / C ++中非常明显,但我在R中寻找等价物。这是一个不言自明的例子:

## SUM OF TWO GAUSSIANS OF DIFFERENT WIDTHS
x=rnorm(n=1000,mean=0,sd=1)
y=rnorm(n=1000,mean=0,sd=3)
z=append(x,y)
b=seq(-10,10,by=0.25)
hist(z,breaks=b)

在这种情况下,各个贡献(x)和(y)是已知的,我可以用内核提取它们的密度曲线:

## NARROW GAUSSIAN
hist(x,prob=T,breaks=b)
dx=density(x,ker="epan")
lines(dx,col=3,lwd=2)

## WIDE GAUSSIAN
hist(y,prob=T,breaks=b)
dy=density(y,ker="epan")
lines(dy,col=2,lwd=2)

我想做点什么     ž〜DX + DY

dx和dy的分数是要拟合的参数。 查看R文档,我只发现了单回归和平滑的参考。

有没有人有线索或有同情心的联系?

提前致谢, X

1 个答案:

答案 0 :(得分:0)

我找到了一种方法,但忽略了内核:

x=rnorm(n=10000,mean=0,sd=1)
y=rnorm(n=10000,mean=0,sd=3)
z=append(x,y)
x=subset(x,abs(x)<=10)
y=subset(y,abs(y)<=10)
z=subset(z,abs(z)<=10)
hx=hist(x,prob=T,breaks=b)
hy=hist(y,prob=T,breaks=b)
hz=hist(z,prob=T,breaks=b)

LM(式= as.formula(HZ $强度〜HX $强度+ HY $强度))

呼叫: lm(公式= as.formula(hz $ intensityities~hx $ intensityities + hy $ intensityities))

系数:    (拦截)hx $强度hy $强度
     4.344e-17 5.002e-01 4.998e-01

假设模板直方图是可靠的(足够的条目,相关的分箱)。 我将同时深入研究如何将其应用于内核的拟合,鉴于此 LM(式= as.formula(HZ $强度〜DX $ Y + DY $ Y)) LM(式= as.formula(Z〜DX $ Y + DY $ Y)) 最终得到错误: 变量长度不同(找到'dx $ y')

因为内核是从全集(x)而不是直方图hx估计的。

谢谢,对马萨诸塞州的问候!