假设我有一个简单的数据框
test_df <- data.frame(c(0,0,1,0,0,1,1,1,1,1),c(1,0,0,0,0,0,0,0,0,0))
我想得到哪一个数字(0或1)是每行的最大值。 在我的示例1中,第一个向量(6次出现),0表示第二个向量(9次出现)。
我开始时:
> sapply(test_df,table)
c.0..0..1..0..0..1..1..1..1..1. c.1..0..0..0..0..0..0..0..0..0.
0 4 9
1 6 1
到目前为止看起来很好。然后
> sapply((sapply(test_df,table)),max)
[1] 4 6 9 1
我迷路了,我是否松开了协会? 1 - &gt; 6,0 - &gt; 9 我想要的是使用&#34;赢家&#34;:1,0,...
返回一个向量1 for the first vector (6 occurrences)
0 for the second vector (9 occurrences)
...
答案 0 :(得分:2)
我们可以apply
使用MARGIN=1
从max
输出的每一行中提取sapply
值。
frqCol <- sapply(test_df, table)
apply(frqCol, 1, max)
# 0 1
# 9 6
或使用rowMaxs
matrixStats
library(matrixStats)
rowMaxs(frqCol)
#[1] 9 6
如果我们需要&#39; max&#39;每列的价值
apply(frqCol, 2, max)
和
colMaxs(frqCol)
使用新示例
test_df <- data.frame(v1= c(0,0,1,0,0,1,1,1,1,1),
v2= c(1,0,0,0,0,0,0,0,0,0),
v3= c(1,0,0,0,0,0,0,0,0,1))
frqCol <- sapply(test_df, table)
apply(frqCol, 2, max)
#v1 v2 v3
#6 9 8
colMaxs(frqCol)
#[1] 6 9 8
答案 1 :(得分:2)
这可以在一个apply
语句中完成。虽然,不清楚你是否想要每个行或列的最大出现次数,所以这两者(使用@akrun的清洁数据集),返回显示每个行/列的'获胜者'(1或0)的向量。
## Data
test_df <- data.frame(v1= c(0,0,1,0,0,1,1,1,1,1),
v2= c(1,0,0,0,0,0,0,0,0,0),
v3= c(1,0,0,0,0,0,0,0,0,1))
# v1 v2 v3
# 1 0 1 1
# 2 0 0 0
# 3 1 0 0
# 4 0 0 0
# 5 0 0 0
# 6 1 0 0
# 7 1 0 0
# 8 1 0 0
# 9 1 0 0
# 10 1 0 1
## Solution - For each row
apply(test_df, 1, function(x) { sum(sum(x == 1) > sum(x == 0)) })
## Result
# [1] 1 0 0 0 0 0 0 0 0 1
## Solution - For each column
apply(test_df, 2, function(x) { sum(sum(x == 1) > sum(x == 0)) })
## Result
# v1 v2 v3
# 1 0 0