使用R base的堆积条形图:如何在每个堆叠条形图中添加值

时间:2016-12-01 20:26:53

标签: r plot bar-chart

我在统计书中找到了一个情节,我想用基础包重现。

情节如下:

enter image description here

到目前为止,我已经有了情节,但是我在向条形的每个部分添加居中标签时遇到了问题。

我的代码如下所示:

data   <- sample( 5, 10 , replace = TRUE )

colors <- c('yellow','violet','green','pink','red')

relative.frequencies <- as.matrix( prop.table( table( data ) ) )

bc <- barplot( relative.frequencies, horiz = TRUE, axes = FALSE, col = colors )

2 个答案:

答案 0 :(得分:2)

对于您的示例,我们可以(所有读者都可以跳过此部分并跳转到下一个):

set.seed(0)  ## `set.seed` for reproducibility
dat <- sample( 5, 10 , replace = TRUE )
colors <- c('yellow','violet','green','pink')
h <- as.matrix( prop.table( table( dat ) ) )
## compute x-location of the centre of each bar
H <- apply(h, 2L, cumsum) - h / 2
## add text to barplot
bc <- barplot(h, horiz = TRUE, axes = FALSE, col = colors )
text(H, bc, labels = paste0(100 * h, "%"))

strip

适用于所有读者

我现在将构建一个全面的例子供您消化这个想法。

第1步:为实验生成百分比的玩具矩阵

## a function to generate `n * p` matrix `h`, with `h > 0` and `colSums(h) = 1`
sim <- function (n, p) {
  set.seed(0)
  ## a positive random matrix of 4 rows and 3 columns
  h <- matrix(runif(n * p), nrow = n)
  ## rescale columns of `h` so that `colSums(h)` is 1
  h <- h / rep(colSums(h), each = n)
  ## For neatness we round `h` up to 2 decimals
  h <- round(h, 2L)
  ## but then `colSums(h)` is not 1 again
  ## no worry, we simply reset the last row:
  h[n, ] <- 1 - colSums(h[-n, ])
  ## now return this good toy matrix
  h
  }

h <- sim(4, 3)
#     [,1] [,2] [,3]
#[1,] 0.43 0.31 0.42
#[2,] 0.13 0.07 0.40
#[3,] 0.18 0.30 0.04
#[4,] 0.26 0.32 0.14

第2步:了解堆积的条形图并获得每个堆积条的“中间高度”

对于堆积条形图,条形图的高度是h每列的累积总和:

H <- apply(h, 2L, cumsum)
#     [,1] [,2] [,3]
#[1,] 0.43 0.31 0.42
#[2,] 0.56 0.38 0.82
#[3,] 0.74 0.68 0.86
#[4,] 1.00 1.00 1.00

我们现在转回h / 2以获得每个堆积条的中间/中心:

H <- H - h / 2
#      [,1]  [,2] [,3]
#[1,] 0.215 0.155 0.21
#[2,] 0.495 0.345 0.62
#[3,] 0.650 0.530 0.84
#[4,] 0.870 0.840 0.93

第3步:生成带有填充数字的条形图

对于垂直条形图,上面的H给出了每个堆积条形中心的y坐标。 x坐标由barplot(无形)返回。请注意,使用x时,我们需要复制每个nrow(H)的元素text次:

x <- barplot(h, col = 1 + 1:nrow(h), yaxt = "n")
text(rep(x, each = nrow(H)), H, labels = paste0(100 * h, "%"))

vertical barchart

对于水平条形图,上面的H给出了每个堆积条形中心的x坐标。 y坐标由barplot(无形)返回。请注意,使用y时,我们需要复制每个nrow(H)的元素text次:

y <- barplot(h, col = 1 + 1:nrow(h), xaxt = "n", horiz = TRUE)
text(H, rep(y, each = nrow(H)), labels = paste0(100 * h, "%"))

Horizontal bar-chart

答案 1 :(得分:2)

以下是使用mapply的另一种解决方案:

invisible(mapply(function(k, l) text(x = (k - l/2), y = bc, 
          labels = paste0(l*100, "%"), cex = 1.5),
          cumsum(relative.frequencies), relative.frequencies))

mapplysapply的多变量版本。在这种情况下,它需要两个输入:cumsum(relative.frequencies)relative.frequencies,并使用这两个向量应用text()函数。 x =是标签的坐标,它将每个累积总和减去每个相应relative.frequencies的一半。然后再次使用relative.frequencies作为要绘制的标签。

invisible()功能禁止将输出打印到控制台。

enter image description here