添加具有最大频率的对象值的列

时间:2016-07-19 14:37:39

标签: r matrix max subset frequency

我有这个矩阵:

mat=matrix(c(1,1,1,2,2,2,3,4,
             4,4,4,4,4,3,5,6,
             3,3,5,5,6,8,0,9,
             1,1,1,1,1,4,5,6),nrow=4,byrow=TRUE)
print(mat)
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
[1,]    1    1    1    2    2    2    3    4
[2,]    4    4    4    4    4    3    5    6
[3,]    3    3    5    5    6    8    0    9
[4,]    1    1    1    1    1    4    5    6

和我想要应用我的函数的行索引的子集:

subset=c(2,4)

我想在矩阵“mat”中添加一个新列,它仅包含我指定的子集,包含行中最大频率的对象的值。

在这种情况下:

  • 对于第1行,我想在新列中有一个空单元格,
  • 对于第2行,我希望新列中的值为“4”,
  • 对于第3行,我想在新列中有一个空单元格,
  • 对于第4行,我希望新列中的值为“1”。

编辑: 感谢答案中的代码! 现在我应该用其他值替换NA值: 我有另一个矩阵:

mat2=matrix(c(24,1,3,2, 4,4,4,4, 3,2,2,5, 1,3,5,1),nrow=4,byrow=TRUE)

     [,1] [,2] [,3] [,4]
[1,]   24    1    3    2
[2,]    4    4    4    4
[3,]    3    2    2    5
[4,]    1    3    5    1

和子集:

subset=c(1,3)

我希望将矩阵的NA(第一个子集中的剩余行)与具有最大值的行的值的名称进行复制。

在这种情况下,我的第一行为“1”,第三行为“4”。

2 个答案:

答案 0 :(得分:4)

您正在寻找模式。不幸的是,R并没有提供内置模式功能。但是编写自己的文章并不难:

## create mode function
modeValue <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

## add new column with NA
smat <- cbind(mat, NA)

## calculate mode for subset
smat[subset, ncol(smat)] <- apply(smat[subset, , drop=FALSE], 1, modeValue)
smat
#      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
# [1,]    1    1    1    2    2    2    3    4   NA
# [2,]    4    4    4    4    4    3    5    6    4
# [3,]    3    3    5    5    6    8    0    9   NA
# [4,]    1    1    1    1    1    4    5    6    1

答案 1 :(得分:0)

这是一个可行的功能。它计算所有行的这些值(模式),然后在需要的地方替换缺失:

myFunc <- function(x, myRows) {

  myModes <- apply(mat, 1, FUN=function(i) {
                temp<- table(i)
                as.numeric(names(temp)[which.max(temp)])
             })
  myModes[setdiff(seq.int(nrow(x)), myRows)] <- NA
  myModes
}

例如,这将返回

myFunc(mat, c(2,4))
[1] NA  4 NA  1

要将其添加到矩阵中,只需使用cbind

cbind(mat, myFunc(mat, c(2,4)))
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
[1,]    1    1    1    2    2    2    3    4   NA
[2,]    4    4    4    4    4    3    5    6    4
[3,]    3    3    5    5    6    8    0    9   NA
[4,]    1    1    1    1    1    4    5    6    1