我使用count(case ..)在sql中对年龄进行分组,最后得到以下数据帧:
0-10 11-16 17-20 21-30 31-40 41-50 51-60 61-70 over70 age_unknown
60 285 161 368 476 453 247 101 62 114
我想转置这个并添加列标题的“年龄范围”和“数字”,但据我所知,重塑功能需要在开头存在标题,所以我不知道该如何去对这个。非常感谢。
答案 0 :(得分:1)
如果是这样的1行数据框:
df <- data.frame(matrix(c(60, 285, 161, 368, 476, 453, 247, 101, 62, 114),
nrow = 1))
names(df) <- c("0-10", "11-16", "17-20", "21-30", "31-40", "41-50",
"51-60", "61-70", "over70", "age_unknown")
df
> df
0-10 11-16 17-20 21-30 31-40 41-50 51-60 61-70 over70 age_unknown
1 60 285 161 368 476 453 247 101 62 114
然后,一个简单的操作将以您想要的格式创建数据框:
df2 <- data.frame(age_range = names(df), number = as.numeric(df[1, ]))
df2
> df2
age_range number
1 0-10 60
2 11-16 285
3 17-20 161
4 21-30 368
5 31-40 476
6 41-50 453
7 51-60 247
8 61-70 101
9 over70 62
10 age_unknown 114
更简单的方法可能是使用df
转置t()
,然后修正结果:
df3 <- t(df)
df3 <- cbind.data.frame(rownames(df3), df3)
rownames(df3) <- NULL
names(df3) <- c("age_range","number")
df3
> df3
age_range number
1 0-10 60
2 11-16 285
3 17-20 161
4 21-30 368
5 31-40 476
6 41-50 453
7 51-60 247
8 61-70 101
9 over70 62
10 age_unknown 114
> str(df3)
'data.frame': 10 obs. of 2 variables:
$ age_range: Factor w/ 10 levels "0-10","11-16",..: 1 2 3 4 5 6 7 8 10 9
$ number : num 60 285 161 368 476 453 247 101 62 114
答案 1 :(得分:1)
您可能正在寻找的是stack
。使用Gavin回答的数据:
> stack(df)
values ind
1 60 0-10
2 285 11-16
3 161 17-20
4 368 21-30
5 476 31-40
6 453 41-50
7 247 51-60
8 101 61-70
9 62 over70
10 114 age_unknown
答案 2 :(得分:0)
如果您有一些连续变量 age 并且您知道所需的切割点:
age <- rnorm(100,40,10)
cutpoints <- c(0,10,20,30,40,50,60,70,max(age))
fage <- table( cut(age, breaks=cutpoints) )
fage 本身可能就是您所需要的一切。但如果您真的想要数据框中的数据:
df <- data.frame(age=names(fage), frequency=as.vector(fage))