加权。 R中的平均误差

时间:2018-05-25 07:10:14

标签: r dataframe mean weighted-average

我创建了以下数据框

 df<-data.frame("A"<-c(1:20), "B"<-c(21:40),"C"<-c(11:30))
 names(df)<-c("A", "B", "C")
 nameslist<-c("A", "B")

我正在尝试获得两个列组合的均值和加权平均值

我试过这个

   mean(df[,names(df)[names(df)%in%nameslist]])

我收到以下错误。

Warning message:
In mean.default(df[, names(df)[names(df) %in% nameslist]]) :
  argument is not numeric or logical: returning NA

我也试过计算加权平均值如下

 weighted.mean(df[,names(df)[names(df)%in%nameslist]])
 410

在这种情况下,我的输出为410。我无法揭露我错在哪里。我请求有人在这里指导我

1 个答案:

答案 0 :(得分:0)

要想要列A和B的全局均值,请尝试以下代码:

mean(unlist(df[,which(colnames(df)%in%nameslist)]))
[1] 20.5

关于weighted.mean您首先要定义w

w   
a numerical vector of weights the same length as x giving the weights to use for elements of x.

一个例子:

w<-c(0.5,1)   
weighted.mean(unlist(df[,which(colnames(df)%in%nameslist)]),c(rep(w[1],nrow(df)),rep(w[2],nrow(df))))
        [1] 23.83333

更新: 如果要根据值大于零的行数导出权重,可以使用解决方案:

w<-c(mean(df[,1]>0),mean(df[,2]>0))