如何通过因子变量和计数列聚合数据

时间:2016-11-10 11:57:08

标签: r aggregate

我有一个因子变量列的数据框,一个数字列和一个整数列。 我想将数据汇总到唯一因子变量组合并总结计数。 使用聚合我得到了独特的因子组合,但它并没有总结计数列。

数据数据框test2

        Afdeling_1         Probleemgebied               Locatie.niveau.1            Risico count    cost
1  Secondairy assembly Complete transformator         Secundaire installatie  Risico 3 ( hoog)     1      NA
2          Active part             Binnenwerk                    Actief deel  Risico 3 ( hoog)     1      NA
3         Construction Complete transformator         Secundaire installatie Risico 2 (midden)     1      NA
4       Final assembly          Complete kast         Complete transformator  Risico 3 ( hoog)     1      NA
5          Windingshop              Wikkeling                      Wikkeling  Risico 3 ( hoog)     1      NA
6            Warehouse Complete transformator Niet transformator gerelateerd   Risico 1 (laag)     1      NA
7          Active part         Wikkelingenset                 Wikkelingenset   Risico 1 (laag)     1      NA
8            Warehouse Complete transformator         Secundaire installatie Risico 2 (midden)     1      NA
9         Pre assembly          Complete kast  Kastbodem (altijd onderzijde) Risico 2 (midden)     1      NA
10        Pre assembly          Complete kast  Kastbodem (altijd onderzijde) Risico 2 (midden)     1      NA
11      Final assembly Complete transformator                    Conservator  Risico 3 ( hoog)     1      NA
12      Final assembly Complete transformator         Complete transformator  Risico 3 ( hoog)     1      NA
13        Pre assembly          Complete kast                    Leidingwerk Risico 2 (midden)     1      NA
14                 KAM             Binnenwerk                    Actief deel   Risico 1 (laag)     1      NA
15      Final assembly          Complete kast         Complete transformator  Risico 3 ( hoog)     1      NA
16        Pre assembly          Complete kast                        Koeling Risico 2 (midden)     1      NA
17                 KAM         Wikkelingenset                 Wikkelingenset   Risico 1 (laag)     1      NA
18      Final assembly             Binnenwerk                    Actief deel  Risico 3 ( hoog)     1      NA
19         Active part         Wikkelingenset                 Wikkelingenset   Risico 1 (laag)     1      NA
20         Active part         Wikkelingenset                 Wikkelingenset  Risico 3 ( hoog)     1      NA
21         Active part             Binnenwerk                    Actief deel  Risico 3 ( hoog)     1      NA
22 Secondairy assembly Complete transformator         Secundaire installatie  Risico 3 ( hoog)     1      NA
23                 KAM          Complete kast                        Koeling Risico 2 (midden)     1      NA
24      Final assembly          Complete kast                       Kastwand   Risico 1 (laag)     1      NA
25        Pre assembly          Complete kast  Kastbodem (altijd onderzijde)  Risico 3 ( hoog)     1      NA
26        Construction             Binnenwerk                    Actief deel   Risico 1 (laag)     1      NA
27      Final assembly Complete transformator Niet transformator gerelateerd  Risico 3 ( hoog)     1      NA
28      Final assembly             Binnenwerk                    Actief deel   Risico 1 (laag)     1      NA
29      Spoelenmontage         Wikkelingenset                 Wikkelingenset   Risico 1 (laag)     1      NA
30         Active part                   Kern                           Kern  Risico 3 ( hoog)     1 1820.00
31         Active part                   Kern                           Kern   Risico 1 (laag)     1      NA
32         Windingshop              Wikkeling                      Wikkeling Risico 2 (midden)     1      NA
33      Final assembly Complete transformator                       Kastwand  Risico 3 ( hoog)     1      NA
34         Active part         Wikkelingenset                 Wikkelingenset Risico 2 (midden)     1 1407.36
35         Active part         Wikkelingenset                 Wikkelingenset   Risico 1 (laag)     1      NA
36         Active part         Wikkelingenset                 Wikkelingenset   Risico 1 (laag)     1      NA
37 Secondairy assembly Complete transformator         Secundaire installatie  Risico 3 ( hoog)     1      NA
38           Warehouse Complete transformator Niet transformator gerelateerd Risico 2 (midden)     1      NA
39           Warehouse Complete transformator                       Kastwand Risico 2 (midden)     1      NA
40      Final assembly          Complete kast  Kastbodem (altijd onderzijde)  Risico 3 ( hoog)     1      NA
41           Warehouse Complete transformator Niet transformator gerelateerd  Risico 3 ( hoog)     1      NA
42           Warehouse Complete transformator Niet transformator gerelateerd  Risico 3 ( hoog)     1      NA
43      Spoelenmontage              Wikkeling                      Wikkeling   Risico 1 (laag)     1      NA
44    Sales & projects Complete transformator         Complete transformator  Risico 3 ( hoog)     1      NA
45         Active part             Binnenwerk                    Actief deel   Risico 1 (laag)     1      NA
46                 KAM Complete transformator         Complete transformator Risico 2 (midden)     1      NA
47         Windingshop              Wikkeling                      Wikkeling   Risico 1 (laag)     1      NA
48    Sales & projects Complete transformator         Complete transformator   Risico 1 (laag)     1      NA
49         Active part             Binnenwerk                    Actief deel   Risico 1 (laag)     1      NA
50        Pre assembly          Complete kast                        Koeling  Risico 3 ( hoog)     1      NA

这是我使用的代码:

aggregate(count ~., test2, sum)

这是我得到的结果:

  Afdeling_1 Probleemgebied Locatie.niveau.1            Risico    cost count
1 Active part Wikkelingenset   Wikkelingenset Risico 2 (midden) 1407.36     1
2 Active part           Kern             Kern  Risico 3 ( hoog) 1820.00     1

我发现潜在的问题不是聚合不起作用,而是成本列有NA,并且数据只汇总到有成本的记录。因此,我需要一种不遗漏NA的方法。

0 个答案:

没有答案