在绘图中打印频率(作为数字)

时间:2013-10-14 12:29:11

标签: r plot

在R中,我想在一个图中插入频率(作为数字):

my code to create the plot:
par(mar=c(4.5,4.5,9.5,4), xpd=TRUE)  
plot(factor(ArtMehrspr)~Mehrspr_Vielf, data=datProjektMehr, col=terrain.colors(4), 
     bty='L', main="Vielfalt nutzen")  
legend("topright", inset=c(0,-.225), title="Art der Mehrsprachigkeit",  levels(factor(datProjektMehr$ArtMehrspr)), 
       fill=terrain.colors(4), horiz=TRUE)  
par(mar=c(5,4,4,2)+0.1) 

enter image description here

在图中,描绘了我的数据框的2列:ArtMehrsprMehrspr_Vielf。 现在我想知道的是,有多少“Kombi”在类别“1”中,有多少“Paral”在类别“1”中等等,然后在图中打印这个数字,以便在每个方块的情节,我可以看到相应的观察数量。 R必须知道这些数字,否则根据观察的数量不能改变不同盒子的高度。因此,将这些数字纳入情节并不难,是吗?

使用命令table(),我可以得到这些数字,但我必须有5 table() - 命令来获取所有数字。 category = 1的示例:

> table(subset(datProjektMehr, Mehrspr_Vielf=="1")$ArtMehrspr)  
einspr  Kombi  Paral  Versc  Wechs   
0          1       9     2       1 

显然,你可以通过添加命令labels = TRUE来实现我想要的。但它不起作用:

par(mar=c(4.5,4.5,9.5,4), xpd=TRUE, labels = TRUE)  
plot(factor(ArtMehrspr)~Mehrspr_Vielf, data=datProjektMehr, col=terrain.colors(4), 
     bty='L', main="Vielfalt nutzen")  
legend("topright", inset=c(0,-.225), title="Art der Mehrsprachigkeit", levels(factor(datProjektMehr$ArtMehrspr)), 
       fill=terrain.colors(4), horiz=TRUE)  
par(mar=c(5,4,4,2)+0.1)

R给了我以下警告信息:

Warning message:
In par(mar = c(4.5, 4.5, 9.5, 4), xpd = TRUE, labels = TRUE) :
  "labels" is not a graphical parameter

这不是正确的命令吗?有谁知道怎么做?

1 个答案:

答案 0 :(得分:0)

首先,warning表示您可以在labels内使用par参数。

关于table输出的绘图,我不知道是否有一种简单的方法可以做到这一点,但我管理了一个非常不可靠且可能效率低下的代码。但是,在我的机器中,每次运行它都会起作用。

我想到的概念是text来自你的table内的所有价值观。为此,必须估计xx'和yy'中的坐标。我更喜欢术语“估计”而不是“计算”,因为我没有找到计算坐标绝对值的方法,因为plot方法是plot.factor

所以:

    #random data.  DF = datProjektMehr, artmehr = ArtMehrspr, mehrviel = Mehrspr_Vielf 
    DF <- data.frame(artmehr = sample(letters[1:4], 20, T), mehrviel = as.factor(sample(1:5, 20, T)))

    #your code of plotting
    par(mar = c(4.5,4.5,9.5,4), xpd = TRUE)
    plot(factor(artmehr) ~ mehrviel, data = DF, col = terrain.colors(4),
         bty = 'L', main = "Vielfalt nutzen")
    legend("topright", inset=c(0,-.225), title="Art der Mehrsprachigkeit",    levels(factor(DF$artmehr)),
           fill=terrain.colors(4), horiz=TRUE)

    #no need to "table()" many times
    tab = table(DF$artmehr, DF$mehrviel)

    #maximum value of x axis (at least in my machine)
    #I found -through trial and error- that for a factor of n levels, x.max = 1 + (n-1)*0.02
    x.max = 1 + (length(levels(DF$mehrviel)) - 1) * 0.02

    #coordinates of "mehrviel" (as I named it)
    mehrviel.coords = ((cumsum(apply(tab, 2, sum)) / sum(tab)) * x.max) - ((apply(tab, 2, sum) / sum(tab)) / 2)

    #coordinates of "artmehr" (as I named it)
    artmehr.coords <- apply(tab, 2, function(x) { cumsum(x / sum(x)) })
    artmehr.coords <- apply(artmehr.coords, 2, function(x) { x - c(x[1]/2, diff(x)/2) })

    #"text" the values in your table
    #don't plot "0"s
    for(i in 1:ncol(artmehr.coords))
     {
      text(x = mehrviel.coords[i], y = artmehr.coords[,i], labels = ifelse(tab[,i] != 0, tab[,i], ""), cex = 2)
     }

table

的值
    tab
       1 2 3 4 5
     a 1 1 0 1 0
     b 0 0 2 1 2
     c 1 1 2 1 0
     d 2 0 0 3 2

情节:

plot_example

编辑:1)“整理”答案。 2)为在xx'轴上绘制的因子添加了额外level以精确匹配您的数据。 3)text编辑每个框中间的频率。