使用R和GraphPad Prism进行分位数计算

时间:2017-06-13 13:00:49

标签: r boxplot outliers quantile

我是R的新手。在使用R之前,我使用了GraphPad Prism 7.0。 Só现在我想把它们作为数据处理器进行比较。我在分位数计算中找到了一个区别,所以任何人都知道为什么它们是不同的?

在R我有

par(pty="s", cex.axis=1, las=1, cex.lab=1)
a1=c(22.02, 23.83,  26.67,  25.38,  25.49,  23.50,  25.90,  24.89, 25)
a2=c(21.49, 22.67,  24.62,  24.18,  22.78,  22.56,  24.46,  23.79, 25)
a3=c(20.33, 21.67,  24.67,  22.45,  22.29,  21.95,  20.49,  21.81, 25)
boxplot(a1,a2,a3, names=c("a1","a2","a3"), ylab="Valor", ylim=c(20,28))

enter image description here

a3的分位数是

quantile(a3)
   0%   25%   50%   75%  100% 
20.33 21.67 21.95 22.45 25.00

在GraphPad Prism中绘制相同的数据:

图族:列 盒子&晶须 情节:tukey

我得到了

enter image description here

分位数是

enter image description here

为什么他们是不同的(特别是a3)??

为什么R识别a3中的4个异常值而GraphPad不识别?

建议??

2 个答案:

答案 0 :(得分:2)

正如@lmo所说,R有很多种计算分位数的方法。默认情况下,R使用type=7。 GraphPad使用的方法相当于R中的type=6。所以我建立的方式是

par(pty="s", cex.axis=1, las=1, cex.lab=1)
a1=c(22.02, 23.83,  26.67,  25.38,  25.49,  23.50,  25.90,  24.89, 25)
a2=c(21.49, 22.67,  24.62,  24.18,  22.78,  22.56,  24.46,  23.79, 25)
a3=c(20.33, 21.67,  24.67,  22.45,  22.29,  21.95,  20.49,  21.81, 25)
boxplot(
  quantile(a1,type=6),
  quantile(a2,type=6),
  quantile(a3,type=6), 
  names=c("a1","a2","a3"), ylab="Valor", ylim=c(20,28))

enter image description here

> quantile(a1,type=6)
    0%    25%    50%    75%   100% 
22.020 23.665 25.000 25.695 26.670 
> quantile(a2,type=6)
    0%    25%    50%    75%   100% 
21.490 22.615 23.790 24.540 25.000 
> quantile(a3,type=6)
   0%   25%   50%   75%  100% 
20.33 21.08 21.95 23.56 25.00

与GraphPad相同

答案 1 :(得分:0)

回答如何在箱线图中使用不同分位数计算的问题:

使用ggplot2很容易。

DF <- data.frame(a1, a2, a3)
DF <- stack(DF)

quants <- tapply(DF$values, list(DF$ind), quantile, type = 6)
quants <- as.data.frame(do.call(rbind, quants))
quants$g <- rownames(quants)

library(ggplot2)
ggplot(quants, aes(x = g, lower = `25%`, 
                   middle = `50%`, upper = `75%`,
                   ymin = `0%`, ymax = `100%`)) +
  geom_boxplot(stat = "identity")

resulting plot

然后,您可以按照许多ggplot2教程中的说明进一步自定义此图。

PS:但是,我会使用R的默认boxplot统计数据,因为这些会尝试重现Tukey的boxplot。