如何为每一列重复计算?

时间:2018-12-19 11:48:28

标签: r loops for-loop

我有一个数据集,如下所示:

V1 V2 V3 ...
1  1  2 ...
1  1  2 ...
2  3  NA...
NA 2  1 ...
2  1  3 ...

它包含2535列,我想对所有列使用以下索引。我已经设法计算出第一列的索引。

 ((max(table(df$V1)))-0.5*
             ((table(df$V1)["1"]+table(df$V1)["2"]+table(df$V1)["3"])
              - (max(table(df$V1)))))/(table(df$V1)["1"]+table(df$V1)["2"]+table(df$V1)["3"])

有没有一种方法可以计算每2535列的索引?我曾考虑过使用循环,但没有设法写一个循环...

1 个答案:

答案 0 :(得分:0)

您应该查看tidyverse软件包dplyr,特别是mutate_atmutate_if

您的职能是什么?即您想对每一列执行什么操作?

如果要对数据中的所有数字列执行此操作:

library(tidyverse)
mutate_if(data, is.numeric, your_function)


data = data.frame(V1 = sample(1:5, 10, replace = T),
    V2 = sample(1:5, 10, replace = T),
    V3 = sample(1:5, 10, replace = T))

mutate_if(data, is.numeric, mean) %>% unique()

       V1  V2  V3
    1 2.9 2.4 2.7