我有一个数据集,如下所示:
V1 V2 V3 ...
1 1 2 ...
1 1 2 ...
2 3 NA...
NA 2 1 ...
2 1 3 ...
它包含2535列,我想对所有列使用以下索引。我已经设法计算出第一列的索引。
((max(table(df$V1)))-0.5*
((table(df$V1)["1"]+table(df$V1)["2"]+table(df$V1)["3"])
- (max(table(df$V1)))))/(table(df$V1)["1"]+table(df$V1)["2"]+table(df$V1)["3"])
有没有一种方法可以计算每2535列的索引?我曾考虑过使用循环,但没有设法写一个循环...
答案 0 :(得分:0)
您应该查看tidyverse软件包dplyr,特别是mutate_at
或mutate_if
。
您的职能是什么?即您想对每一列执行什么操作?
如果要对数据中的所有数字列执行此操作:
library(tidyverse)
mutate_if(data, is.numeric, your_function)
data = data.frame(V1 = sample(1:5, 10, replace = T),
V2 = sample(1:5, 10, replace = T),
V3 = sample(1:5, 10, replace = T))
mutate_if(data, is.numeric, mean) %>% unique()
V1 V2 V3
1 2.9 2.4 2.7