对于以下类型的问题,有一些答案,但是它们都效率低下,并且扩展性不佳。
要重现它,假设我有如下数据:
tempmat=matrix(c(1,1,0,4,1,0,0,4,0,1,0,4, 0,1,1,4, 0,1,0,5),5,4,byrow=T)
tempmat=rbind(rep(0,4),tempmat)
tempmat=data.table(tempmat)
names(tempmat)=paste0('prod1vint',1:4)
这是数据的样子,尽管它要大得多,所以解决方案不能是“应用”或基于行的方法。
> tempmat
prod1vint1 prod1vint2 prod1vint3 prod1vint4
1: 0 0 0 0
2: 1 1 0 4
3: 1 0 0 4
4: 0 1 0 4
5: 0 1 1 4
6: 0 1 0 5
我想标识第一个非零元素的列,所以输出看起来像这样:
> tempmat
prod1vint1 prod1vint2 prod1vint3 prod1vint4 firstnonzero
1: 0 0 0 0 NA
2: 1 1 0 4 1
3: 1 0 0 4 1
4: 0 1 0 4 2
5: 0 1 1 4 2
6: 0 1 0 5 2
答案 0 :(得分:2)
一种选择是将rowSums
与max.col
一起使用ties.method = "first"
temp <- tempmat != 0
(NA^(rowSums(temp) == 0)) * max.col(temp, ties.method = "first")
#[1] NA 1 1 2 2 2
max.col
将给出每一行中第一个最大值的列索引。但是,如果所有值均为0(如第1行),则返回1,因为0是该行的最大值。为避免这种情况,我们使用rowSums
检查行中是否至少有一个非零值,并将其乘以max.col
输出。