通过条件选择r中的多个列来切片数据

时间:2017-03-22 11:49:27

标签: r data-manipulation

我在 item_weight 中有一个NA的数据集。还有另一个名为 item_type 的属性,其级别包括乳制品,厨房,家庭等。

我使用cbind()来获取一些值。

         x        y                      
     [1,] "9.3"    "Dairy"                `
     [2,] "5.92"   "Soft Drinks"          
     [3,] "17.5"   "Meat"                 
     [4,] "19.2"   "Fruits and Vegetables"
     [5,] "8.93"   "Household"            
     [6,] "10.395" "Baking Goods"         
     [7,] "13.65"  "Snack Foods"          
     [8,] NA       "Snack Foods"          

我希望选择item_weight 的NA,以便替换对应于不同item_types 的item_weights 的平均值。

例如:乳制品item_type的值被替换为NA' s仅对应于Dairy Item_type。

P.S.i已经找到了使用data.table包的item_types的个别方法,我坚持用替换NA' s。 data.table: -

    library(data.table)
    dt<-data.table(train)
    dt[,mean(Item_Weight,na.rm = T),by=Item_Type]

数据表的输出:

    Item_Type       V1
    1:                 Dairy 13.42607
    2:           Soft Drinks 11.84746
    3:                  Meat 12.81734

0 个答案:

没有答案