在R中,我想在一个图中插入频率(作为数字):
my code to create the plot:
par(mar=c(4.5,4.5,9.5,4), xpd=TRUE)
plot(factor(ArtMehrspr)~Mehrspr_Vielf, data=datProjektMehr, col=terrain.colors(4),
bty='L', main="Vielfalt nutzen")
legend("topright", inset=c(0,-.225), title="Art der Mehrsprachigkeit", levels(factor(datProjektMehr$ArtMehrspr)),
fill=terrain.colors(4), horiz=TRUE)
par(mar=c(5,4,4,2)+0.1)
在图中,描绘了我的数据框的2列:ArtMehrspr
和Mehrspr_Vielf
。
现在我想知道的是,有多少“Kombi”在类别“1”中,有多少“Paral”在类别“1”中等等,然后在图中打印这个数字,以便在每个方块的情节,我可以看到相应的观察数量。 R必须知道这些数字,否则根据观察的数量不能改变不同盒子的高度。因此,将这些数字纳入情节并不难,是吗?
使用命令table()
,我可以得到这些数字,但我必须有5 table()
- 命令来获取所有数字。 category = 1的示例:
> table(subset(datProjektMehr, Mehrspr_Vielf=="1")$ArtMehrspr)
einspr Kombi Paral Versc Wechs
0 1 9 2 1
显然,你可以通过添加命令labels = TRUE
来实现我想要的。但它不起作用:
par(mar=c(4.5,4.5,9.5,4), xpd=TRUE, labels = TRUE)
plot(factor(ArtMehrspr)~Mehrspr_Vielf, data=datProjektMehr, col=terrain.colors(4),
bty='L', main="Vielfalt nutzen")
legend("topright", inset=c(0,-.225), title="Art der Mehrsprachigkeit", levels(factor(datProjektMehr$ArtMehrspr)),
fill=terrain.colors(4), horiz=TRUE)
par(mar=c(5,4,4,2)+0.1)
R给了我以下警告信息:
Warning message:
In par(mar = c(4.5, 4.5, 9.5, 4), xpd = TRUE, labels = TRUE) :
"labels" is not a graphical parameter
这不是正确的命令吗?有谁知道怎么做?
答案 0 :(得分:0)
首先,warning
表示您可以在labels
内使用par
参数。
关于table
输出的绘图,我不知道是否有一种简单的方法可以做到这一点,但我管理了一个非常不可靠且可能效率低下的代码。但是,在我的机器中,每次运行它都会起作用。
我想到的概念是text
来自你的table
内的所有价值观。为此,必须估计xx'和yy'中的坐标。我更喜欢术语“估计”而不是“计算”,因为我没有找到计算坐标绝对值的方法,因为plot
方法是plot.factor
。
所以:
#random data. DF = datProjektMehr, artmehr = ArtMehrspr, mehrviel = Mehrspr_Vielf
DF <- data.frame(artmehr = sample(letters[1:4], 20, T), mehrviel = as.factor(sample(1:5, 20, T)))
#your code of plotting
par(mar = c(4.5,4.5,9.5,4), xpd = TRUE)
plot(factor(artmehr) ~ mehrviel, data = DF, col = terrain.colors(4),
bty = 'L', main = "Vielfalt nutzen")
legend("topright", inset=c(0,-.225), title="Art der Mehrsprachigkeit", levels(factor(DF$artmehr)),
fill=terrain.colors(4), horiz=TRUE)
#no need to "table()" many times
tab = table(DF$artmehr, DF$mehrviel)
#maximum value of x axis (at least in my machine)
#I found -through trial and error- that for a factor of n levels, x.max = 1 + (n-1)*0.02
x.max = 1 + (length(levels(DF$mehrviel)) - 1) * 0.02
#coordinates of "mehrviel" (as I named it)
mehrviel.coords = ((cumsum(apply(tab, 2, sum)) / sum(tab)) * x.max) - ((apply(tab, 2, sum) / sum(tab)) / 2)
#coordinates of "artmehr" (as I named it)
artmehr.coords <- apply(tab, 2, function(x) { cumsum(x / sum(x)) })
artmehr.coords <- apply(artmehr.coords, 2, function(x) { x - c(x[1]/2, diff(x)/2) })
#"text" the values in your table
#don't plot "0"s
for(i in 1:ncol(artmehr.coords))
{
text(x = mehrviel.coords[i], y = artmehr.coords[,i], labels = ifelse(tab[,i] != 0, tab[,i], ""), cex = 2)
}
table
:
tab
1 2 3 4 5
a 1 1 0 1 0
b 0 0 2 1 2
c 1 1 2 1 0
d 2 0 0 3 2
情节:
编辑:1)“整理”答案。 2)为在xx'轴上绘制的因子添加了额外level
以精确匹配您的数据。 3)text
编辑每个框中间的频率。