我试图在R中叠加三个不同的密度图来创建一个显示所有三条线的图(叠加)。我安装/加载了sm
软件包,但我尝试将其与我的数据一起使用无济于事。
我使用density()
创建了三个单独的数据图并绘制了值。我的代码如下所示:
library(sm)
set.seed(0)
x <- rnorm(100, 0, 1)
y <- rnorm(126, 0.3, 1.2)
z <- rnorm(93, -0.5, 0.7)
dx <- density(x)
dy <- density(y)
dz <- density(z)
plot(dx)
plot(dy)
plot(dz)
但是,当我尝试使用sm.density.compare()
覆盖图表时:
sm.density.compare(dx,dy,model="equal")
我收到错误消息:
sm.density.compare中的错误(dx,dy,model =&#34;等于&#34;):
sm.density.compare只能处理1-d数据跟踪:
任何人都知道如何解决这个问题?我研究了很多但没有成功。我是R的新手,可以真正使用帮助。
答案 0 :(得分:6)
如果您想使用sm.density.compare()
,请不要使用density()
。
sm.density.compare()
本身正在进行密度估算。具体来说,它正在对分组数据进行密度估计,以便您可以在同一图表上绘制不同组的密度。
以下是您真正需要做的事情:
## three groups, each of length: length(x), length(y), length(z)
group.index <- rep(1:3, c(length(x), length(y), length(z)))
## collect data together and use sm.density.compare()
den <- sm.density.compare(c(x,y,z), group = group.index, model = "equal")
## plot will be generated automatically
使用model = "equal"
时,sm.density.compare()
已返回值。看看str(den)
:
List of 4
$ p : num 0
$ estimaate : num [1:3, 1:50] 2.37e-07 3.81e-06 6.06e-10 2.17e-06 2.26e-05 ...
$ eval.points: num [1:50] -4.12 -3.94 -3.76 -3.58 -3.4 ...
$ h : num 0.376
h
包含用于所有密度估算的带宽,eval.points
包含估算点,而estimaate
是密度估算值的矩阵。 ( Adrian在这里有一个错字,它应该是&#34;估计&#34;,不是&#34;估计&#34;,LOL )。
来自sm
包的所有函数(从前缀sm.
开始)接受可选参数...
,传递给sm.options
。阅读?sm.options
,你会发现你可以完全控制彩色显示,线型和线宽,带宽选择方法等。
参考范围仅添加到两组数据中。即,对于成对比较,sm.density.compare()
可以做更多。例如:
den2 <- sm.density.compare(c(x,y), group = rep(1:2, c(length(x), length(y))),
model = "equal")
> str(den2)
List of 6
$ p : num 0.22
$ estimate : num [1:2, 1:50] 4.92e-06 2.70e-05 2.51e-05 1.00e-04 1.09e-04 ...
$ eval.points: num [1:50] -4.12 -3.94 -3.76 -3.58 -3.4 ...
$ upper : num [1:50] 0.00328 0.00373 0.00459 0.00614 0.00886 ...
$ lower : num [1:50] 0 0 0 0 0 ...
$ h : num 0.44
其中lower
和upper
给出了参考带/置信区域的界限。
如果您使用density()
,请不要使用sm.density.compare()
## set universal estimation range
xlim <- range(x, y, z)
dx <- density(x, from = xlim[1], to = xlim[2], n = 200)
dy <- density(y, from = xlim[1], to = xlim[2], n = 200)
dz <- density(z, from = xlim[1], to = xlim[2], n = 200)
在这种情况下,每组的密度估算是独立完成的。每个&#34;密度&#34; object是一个列表,例如:
> str(dx)
List of 7
$ x : num [1:200] -2.64 -2.61 -2.58 -2.55 -2.52 ...
$ y : num [1:200] 0.023 0.026 0.0291 0.0323 0.0356 ...
$ bw : num 0.31
$ n : int 100
$ call : language density.default(x = x, n = 200, from = xlim[1], to = xlim[2])
$ data.name: chr "x"
$ has.na : logi FALSE
- attr(*, "class")= chr "density"
x
是评估点,y
是估算密度,bw
是使用的带宽。由于独立估算,您会看到dx$bw
,dy$bw
和dz$bw
不同。但是,您可以使用参数bw
在调用density()
时手动指定通用bw
。请参阅?density
,我在此处不做任何示例。
现在,要覆盖这些密度图,你需要自己做。
## set global plotting range
ylim <- range(dx$y, dy$y, dz$y)
## make plot
plot(dx$x, dx$y, col = 1, lwd = 2, type = "l", xlim = xlim, ylim = ylim)
lines(dy$x, dy$y, col = 2, lwd = 2)
lines(dz$x, dz$y, col = 3, lwd = 2)