尝试基于列表循环功能并创建结果表时遇到麻烦。
tokenizer.setInputCol("authorName").setOutputCol("authorNameTokens")
val dfTokens = tokenizer.transform(df.na.fill(Map("authorName" -> "")))
我已经使用head(Dat17_18.3[,c(1,3:5)])
Program Area I.E.ScoreStat I.I.ScoreStat I.P.ScoreStat
1 BFA - Art Education 2 2 2
2 BA - Foreign Language Education 2 2 3
3 MAT - Elementary Education 2 2 2
4 BA - Dance Education 2 3 3
5 MAT - Elementary Education 2 3 3
6 MAT - Elementary Education 2 2 3
函数来创建程序区域列表。
split
我编写了一个函数,用于从test1<- split(Dat17_18.3, Dat17_18.3$`Program Area`)
包中的alpha
函数中提取元素。
psych
我希望对测试一个中的每个元素运行alpha_fun <- function (df,columns){
library(psych)
a1 <- alpha(df[,columns])
a2 <- alpha.ci(a1[[1]][1],nrow(df),length(columns))
vec1 <- c(nrow(x),a1[[1]][1],a2[1],a2[3],a1[[1]][3])
return(vec1)
}
,以便一次为所有程序区域创建一个表。
答案 0 :(得分:1)
考虑类似于by
+ tapply
的{{1}}(split
的面向对象包装器),其中的功能可以直接应用于数据帧分组的每个子集。另外,请避免使用 columns 参数,该参数可以从方法内部的数据框输入中检索:
lapply