我是R的新手。我需要生成一个具有累积频率和相对频率的简单频率表(如书中)。
所以我想从一些简单的数据中生成,比如
> x
[1] 17 17 17 17 17 17 17 17 16 16 16 16 16 18 18 18 10 12 17 17 17 17 17 17 17 17 16 16 16 16 16 18 18 18 10
[36] 12 15 19 20 22 20 19 19 19
表格如下:
frequency cumulative relative
(9.99,11.7] 2 2 0.04545455
(11.7,13.4] 2 4 0.04545455
(13.4,15.1] 1 5 0.02272727
(15.1,16.9] 10 15 0.22727273
(16.9,18.6] 22 37 0.50000000
(18.6,20.3] 6 43 0.13636364
(20.3,22] 1 44 0.02272727
我知道这应该很简单,但我不知道如何。
我使用此代码获得了一些结果:
factorx <- factor(cut(x, breaks=nclass.Sturges(x)))
as.matrix(table(factorx))
答案 0 :(得分:25)
你很亲密!有一些功能可以让您轻松实现,cumsum()
和prop.table()
。这就是我可能把它放在一起的方式。我做了一些随机数据,但重点是:
#Fake data
x <- sample(10:20, 44, TRUE)
#Your code
factorx <- factor(cut(x, breaks=nclass.Sturges(x)))
#Tabulate and turn into data.frame
xout <- as.data.frame(table(factorx))
#Add cumFreq and proportions
xout <- transform(xout, cumFreq = cumsum(Freq), relative = prop.table(Freq))
#-----
factorx Freq cumFreq relative
1 (9.99,11.4] 11 11 0.25000000
2 (11.4,12.9] 3 14 0.06818182
3 (12.9,14.3] 11 25 0.25000000
4 (14.3,15.7] 2 27 0.04545455
5 (15.7,17.1] 6 33 0.13636364
6 (17.1,18.6] 3 36 0.06818182
7 (18.6,20] 8 44 0.18181818
答案 1 :(得分:21)
基本功能table
,cumsum
和prop.table
可以帮助您:
cbind( Freq=table(x), Cumul=cumsum(table(x)), relative=prop.table(table(x)))
Freq Cumul relative
10 2 2 0.04545455
12 2 4 0.04545455
15 1 5 0.02272727
16 10 15 0.22727273
17 16 31 0.36363636
18 6 37 0.13636364
19 4 41 0.09090909
20 2 43 0.04545455
22 1 44 0.02272727
使用cbind并根据自己的喜好命名列,这对你来说应该很容易。表函数的输出是一个矩阵,因此该结果也是一个矩阵。如果这是在大事上做的话,那就更有效了:
tbl <- table(x)
cbind( Freq=tbl, Cumul=cumsum(tbl), relative=prop.table(tbl))
答案 2 :(得分:12)
如果您正在寻找预先打包的内容,请考虑freq()
包中的descr
功能。
library(descr)
x = c(sample(10:20, 44, TRUE))
freq(x, plot = FALSE)
要获得累积百分比,请使用ordered()
函数
freq(ordered(x), plot = FALSE)
添加“累积频率”列:
tab = as.data.frame(freq(ordered(x), plot = FALSE))
CumFreq = cumsum(tab[-dim(tab)[1],]$Frequency)
tab$CumFreq = c(CumFreq, NA)
tab
如果您的数据缺少值,则会向表中添加有效的百分比列。
x = c(sample(10:20, 44, TRUE), NA, NA)
freq(ordered(x), plot = FALSE)
答案 3 :(得分:1)
又一种可能性:
library(SciencesPo)
x = c(sample(10:20, 50, TRUE))
freq(x)
答案 4 :(得分:-1)
我的建议是检查 agricolae 包...查看:
library(agricolae)
weight<-c( 68, 53, 69.5, 55, 71, 63, 76.5, 65.5, 69, 75, 76, 57, 70.5,
+ 71.5, 56, 81.5, 69, 59, 67.5, 61, 68, 59.5, 56.5, 73,
+ 61, 72.5, 71.5, 59.5, 74.5, 63)
h1<- graph.freq(weight,col="yellow",frequency=1,las=2,xlab="h1")
print(summary(h1),row.names=FALSE)