我在 item_weight 中有一个NA的数据集。还有另一个名为 item_type 的属性,其级别包括乳制品,厨房,家庭等。
我使用cbind()
来获取一些值。
x y
[1,] "9.3" "Dairy" `
[2,] "5.92" "Soft Drinks"
[3,] "17.5" "Meat"
[4,] "19.2" "Fruits and Vegetables"
[5,] "8.93" "Household"
[6,] "10.395" "Baking Goods"
[7,] "13.65" "Snack Foods"
[8,] NA "Snack Foods"
我希望选择item_weight 的NA,以便替换对应于不同item_types 的item_weights 的平均值。
例如:乳制品item_type的值被替换为NA' s仅对应于Dairy Item_type。
P.S.i已经找到了使用data.table包的item_types的个别方法,我坚持用替换NA' s。 data.table: -
library(data.table)
dt<-data.table(train)
dt[,mean(Item_Weight,na.rm = T),by=Item_Type]
数据表的输出:
Item_Type V1
1: Dairy 13.42607
2: Soft Drinks 11.84746
3: Meat 12.81734