缩放R数据帧中的数据并将高斯拟合到geom_point

时间:2013-07-12 14:55:59

标签: r ggplot2

基于我的data.frame

的2个问题
structure(list(Collimator = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 
2L, 2L, 2L, 2L), .Label = c("n", "y"), class = "factor"), angle = c(0L, 
15L, 30L, 45L, 60L, 75L, 90L, 105L, 120L, 135L, 150L, 165L, 180L, 
0L, 15L, 30L, 45L, 60L, 75L, 90L, 105L, 120L, 135L, 150L, 165L, 
180L), X1 = c(2099L, 11070L, 17273L, 21374L, 23555L, 23952L, 
23811L, 21908L, 19747L, 17561L, 12668L, 6008L, 362L, 53L, 21L, 
36L, 1418L, 6506L, 10922L, 12239L, 8727L, 4424L, 314L, 38L, 21L, 
50L), X2 = c(2126L, 10934L, 17361L, 21301L, 23101L, 23968L, 23923L, 
21940L, 19777L, 17458L, 12881L, 6051L, 323L, 40L, 34L, 46L, 1352L, 
6569L, 10880L, 12534L, 8956L, 4418L, 344L, 58L, 24L, 68L), X3 = c(2074L, 
11109L, 17377L, 21399L, 23159L, 23861L, 23739L, 21910L, 20088L, 
17445L, 12733L, 6046L, 317L, 45L, 26L, 46L, 1432L, 6495L, 10862L, 
12300L, 8720L, 4343L, 343L, 38L, 34L, 60L), average = c(2099.6666666667, 
11037.6666666667, 17337, 21358, 23271.6666666667, 23927, 23824.3333333333, 
21919.3333333333, 19870.6666666667, 17488, 12760.6666666667, 
6035, 334, 46, 27, 42.6666666667, 1400.6666666667, 6523.3333333333, 
10888, 12357.6666666667, 8801, 4395, 333.6666666667, 44.6666666667, 
26.3333333333, 59.3333333333)), .Names = c("Collimator", "angle", 
"X1", "X2", "X3", "average"), row.names = c(NA, -26L), class = "data.frame")

我希望在有和没有连接到设备的准直器的情况下绘制探测器计数与角度的关系。我想geom_point可能是汇总数据的最佳方式

p <- ggplot(df, aes(x=angle,y=average,col=Collimator)) + geom_point() + geom_line()

我不想在y轴上绘制平均计数,而是希望重新调整数据的大小,使得最大计数的角度对于准直器Y和N都有一个值。我这样做的方式看起来相当麻烦

range01 <- function(x){(x-min(x))/(max(x)-min(x))}
coly = subset(df,Collimator=='y')
coly$norm_count = range01(coly$average)
coln = subset(df,Collimator=='n')
coln$norm_count = range01(coln$average)
df = rbind(coln,coly)
p <- ggplot(df, aes(x=angle,y=norm_count,col=Collimator) + geom_point() + geom_line()

我确信这可以通过更有效的方式完成,将函数应用于基于变量'Collimator'的data.frame。我怎么能这样做?

另外,我想在函数中使用函数,而不是使用geom_line。我认为高斯函数可能在这种情况下起作用,但不知道如何/如果我可以在stat_smooth中实现它。我也可以从这样的拟合中拉出蜂蜜酒/标准差吗?

2 个答案:

答案 0 :(得分:2)

ggplot2 与包 plyr

相辅相成
df <- ddply(df,.(Collimator),
            transform,
            norm_count1 = (average - min(average)) / (max(average) - min(average)) )

答案 1 :(得分:1)

joran's answer将最高值缩放为1,将最低值缩放为0;如果您只想缩放以使最高值为1(并将0保留为0),则更简单。

library("plyr")
df <- ddply(df, .(Collimator), transform,
            norm.average = average / max(average))

情节是

ggplot(df, aes(x=angle,y=norm.average,col=Collimator)) + 
  geom_point() + geom_line()

enter image description here