如何更改点并将回归添加到cloudplot(使用R)?

时间:2011-07-21 10:43:02

标签: r ggplot2 3d regression lattice

要明确我的要求,我已经创造了一个简单的例子。第一步是创建一些数据:

gender <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2),labels = c("male", "female"))
numberofdrugs <- rpois(84, 50) + 1
geneticvalue <- rpois(84,75)
death <- rpois(42,50) + 15
y <- data.frame(death, numberofdrugs, geneticvalue, gender)

所以这些是一些随机日期合并到一个data.frame。因此,从这些日期开始,我想绘制一个云,在那里我可以区分男性和女性,并在那里添加两个简单的回归(一个用于女性,一个用于男性)。所以我已经开始了,但我无法达到我想要的程度。请看下面我到目前为止所做的事情:

require(lattice)
cloud(y$death~y$numberofdrugs*geneticvalue)

cloud plot in basic form

xmale <- subset(y, gender=="male")
xfemale <- subset(y, gender=="female")

death.lm.male <- lm(death~numberofdrugs+geneticvalue, data=xmale)
death.lm.female <- lm(death~numberofdrugs+geneticvalue, data=xfemale)

如何在使用云命令时为男性或女性制作不同的点(例如蓝色和粉红色点而不仅仅是蓝色点),如何将两个估计模型添加到云图中?

任何想法都表示赞赏!谢谢你的想法!

2 个答案:

答案 0 :(得分:18)

回答问题的前半部分,“在使用云命令时,如何为男性或女性制作不同的分数(例如蓝色和粉红色的点只是蓝色十字架)?”

 cloud( death ~ numberofdrugs*geneticvalue , groups=gender, data=y )

grouped cloud plot

对此的元回答可能涉及一些非三维可视化。也许您可以使用lattice或ggplot2将数据拆分成小的倍数?它可能更容易理解,并且可能更容易添加回归结果。

splom( ~ data.frame( death, numberofdrugs, geneticvalue ), groups=gender, data=y )

splom

默认的splom面板功能是panel.pairs,您可以修改它以添加回归线而不会有太多麻烦。

ggplot2可以轻松地在绘图矩阵中进行回归,但是我无法使颜色起作用。

pm <- plotmatrix( y[ , 1:3], mapping = aes(color=death) )
pm + geom_smooth(method="lm")

plotmatrix

最后,如果你真的想用回归平面做一个cloudplot,这里有一种方法可以使用scatterplot3d包。注意我将数据更改为有一些更有趣的结构:

numberofdrugs <- rpois( 84, 50 ) + 1
geneticvalue <- numberofdrugs + rpois( 84, 75 )
death <- geneticvalue + rpois( 42, 50 ) + 15
y <- data.frame( death, numberofdrugs, geneticvalue, gender )

library(scatterplot3d) 
pts <- as.numeric( as.factor(y$gender) ) + 4
s <-scatterplot3d( y$death, y$numberofdrugs, y$geneticvalue, pch=pts, type="p", highlight.3d=TRUE )
fit <- lm( y$death ~ y$numberofdrugs + y$geneticvalue )
s$plane3d(fit)

scatterplot3d with regression plane

答案 1 :(得分:17)

使用car package {/ 3}在rgl package (openGL implementation)中进行了很好的拟合可视化。

require(car)
require(rgl)
scatter3d(death~numberofdrugs+geneticvalue, groups=y$gender, data=y, parallel=FALSE)

3d fit with car package