我想使用tapply函数生成R中数据集的子组的摘要(平均值)。数据集= VehicleData"。我想计算响应变量的平均值," HWY_MPG"数据分为2个因素后; "类型"和"驾驶"。数据集中有一些缺失的数据,因此我使用na.rm = T作为我的参数的一部分。然而,在我应用这个功能之后,Nas又回来了。请问我该怎么做?
tapply(VehicleData$HWY_MPG,list(VehicleData$Type,VehicleData$Drive),mean,na.rm=T)
4wd Front Rear
Car 25.17382 30.68226 24.37903
Minivan 23.26471 24.28902 NA
Pickup 18.82911 NA 21.21270
St.Wagon 26.46635 29.86416 25.61538
SUV 20.60339 26.55390 20.51227
Two_Seater 18.55882 50.26316 24.56571
Van 17.66667 NA 18.38991
答案 0 :(得分:0)
tapply最适合na.rm=TRUE
使用。 na.rm=T
不起作用
尝试以下操作。.
tapply(VehicleData$HWY_MPG,list(VehicleData$Type,VehicleData$Drive),mean,na.rm=TRUE)