我创建了以下数据框
df<-data.frame("A"<-c(1:20), "B"<-c(21:40),"C"<-c(11:30))
names(df)<-c("A", "B", "C")
nameslist<-c("A", "B")
我正在尝试获得两个列组合的均值和加权平均值
我试过这个
mean(df[,names(df)[names(df)%in%nameslist]])
我收到以下错误。
Warning message:
In mean.default(df[, names(df)[names(df) %in% nameslist]]) :
argument is not numeric or logical: returning NA
我也试过计算加权平均值如下
weighted.mean(df[,names(df)[names(df)%in%nameslist]])
410
在这种情况下,我的输出为410。我无法揭露我错在哪里。我请求有人在这里指导我
答案 0 :(得分:0)
要想要列A和B的全局均值,请尝试以下代码:
mean(unlist(df[,which(colnames(df)%in%nameslist)]))
[1] 20.5
关于weighted.mean
您首先要定义w
:
w
a numerical vector of weights the same length as x giving the weights to use for elements of x.
一个例子:
w<-c(0.5,1)
weighted.mean(unlist(df[,which(colnames(df)%in%nameslist)]),c(rep(w[1],nrow(df)),rep(w[2],nrow(df))))
[1] 23.83333
更新: 如果要根据值大于零的行数导出权重,可以使用解决方案:
w<-c(mean(df[,1]>0),mean(df[,2]>0))