Question

作为示例数据集

example.df <- data.frame( 
species = sample(c("primate", "non-primate"), 50, replace = TRUE),
treated = sample(c("Yes", "No"), 50, replace = TRUE), 
gender = sample(c("male", "female"), 50, replace = TRUE), 
var1 = rnorm(50, 100, 5), var2=rnorm(50, 10,5), var3 = rnorm (50, 25, 5))

我正在尝试使用pairw.kw包中的asbio来按变量分组后计算dunn测试的P值。

by(example.df,example.df$treated, function(X) pairw.kw(X$var1, X$species, conf = 0.95))

返回有效结果。

如何修改此代码（或通过其他方式）以遍历其他数字变量（我的实际数据集中有23个）？

编辑：基于下面@ jay.sf的出色回答，我使用了以下代码来解决我的问题。

vars <- colnames(select_if(example.df, is.numeric))
res <- by(example.df, example.df$treated, simplify = FALSE, function(X) sapply(vars, simplify = FALSE, USE.NAMES = TRUE, function(i) pairw.kw(X[[i]], X$species, conf = 0.95)))
res_summary <- res %>% map_depth(2, "summary")
res_summary.df <- do.call(rbind, lapply(sapply(res_summary, `[`, simplify = FALSE, USE.NAMES = TRUE), data.frame))

这将从res转换为我唯一需要的摘要对象，并将其转换为易于使用的数据框。

Answer 1

您可以只构建一个sapply()，该变量循环遍历各个变量。首先，我们需要一个包含数字名称名称的字符向量。

(vars <- names(example.df)[4:6])
# [1] "var1" "var2" "var3"

现在我们将其放入by(.)

library("asbio")
res <- by(example.df, example.df$treated, function(X) sapply(vars, function(i)
  pairw.kw(X[[i]], X$species, conf = 0.95)))

最后，您可以运行str(res)来查看结果中的内容以及如何访问它。

例如

> res$Yes[[4]]
                                        Diff    Lower   Upper Decision Adj. P-value
Avg.ranknon-primate-Avg.rankprimate -0.19444 -5.55705 5.16817   FTR H0     0.943345

循环执行一个函数，该函数返回由另一个变量分组的数据框中的变量列表

1 个答案: