我有一个因子变量列的数据框,一个数字列和一个整数列。 我想将数据汇总到唯一因子变量组合并总结计数。 使用聚合我得到了独特的因子组合,但它并没有总结计数列。
数据数据框test2
Afdeling_1 Probleemgebied Locatie.niveau.1 Risico count cost
1 Secondairy assembly Complete transformator Secundaire installatie Risico 3 ( hoog) 1 NA
2 Active part Binnenwerk Actief deel Risico 3 ( hoog) 1 NA
3 Construction Complete transformator Secundaire installatie Risico 2 (midden) 1 NA
4 Final assembly Complete kast Complete transformator Risico 3 ( hoog) 1 NA
5 Windingshop Wikkeling Wikkeling Risico 3 ( hoog) 1 NA
6 Warehouse Complete transformator Niet transformator gerelateerd Risico 1 (laag) 1 NA
7 Active part Wikkelingenset Wikkelingenset Risico 1 (laag) 1 NA
8 Warehouse Complete transformator Secundaire installatie Risico 2 (midden) 1 NA
9 Pre assembly Complete kast Kastbodem (altijd onderzijde) Risico 2 (midden) 1 NA
10 Pre assembly Complete kast Kastbodem (altijd onderzijde) Risico 2 (midden) 1 NA
11 Final assembly Complete transformator Conservator Risico 3 ( hoog) 1 NA
12 Final assembly Complete transformator Complete transformator Risico 3 ( hoog) 1 NA
13 Pre assembly Complete kast Leidingwerk Risico 2 (midden) 1 NA
14 KAM Binnenwerk Actief deel Risico 1 (laag) 1 NA
15 Final assembly Complete kast Complete transformator Risico 3 ( hoog) 1 NA
16 Pre assembly Complete kast Koeling Risico 2 (midden) 1 NA
17 KAM Wikkelingenset Wikkelingenset Risico 1 (laag) 1 NA
18 Final assembly Binnenwerk Actief deel Risico 3 ( hoog) 1 NA
19 Active part Wikkelingenset Wikkelingenset Risico 1 (laag) 1 NA
20 Active part Wikkelingenset Wikkelingenset Risico 3 ( hoog) 1 NA
21 Active part Binnenwerk Actief deel Risico 3 ( hoog) 1 NA
22 Secondairy assembly Complete transformator Secundaire installatie Risico 3 ( hoog) 1 NA
23 KAM Complete kast Koeling Risico 2 (midden) 1 NA
24 Final assembly Complete kast Kastwand Risico 1 (laag) 1 NA
25 Pre assembly Complete kast Kastbodem (altijd onderzijde) Risico 3 ( hoog) 1 NA
26 Construction Binnenwerk Actief deel Risico 1 (laag) 1 NA
27 Final assembly Complete transformator Niet transformator gerelateerd Risico 3 ( hoog) 1 NA
28 Final assembly Binnenwerk Actief deel Risico 1 (laag) 1 NA
29 Spoelenmontage Wikkelingenset Wikkelingenset Risico 1 (laag) 1 NA
30 Active part Kern Kern Risico 3 ( hoog) 1 1820.00
31 Active part Kern Kern Risico 1 (laag) 1 NA
32 Windingshop Wikkeling Wikkeling Risico 2 (midden) 1 NA
33 Final assembly Complete transformator Kastwand Risico 3 ( hoog) 1 NA
34 Active part Wikkelingenset Wikkelingenset Risico 2 (midden) 1 1407.36
35 Active part Wikkelingenset Wikkelingenset Risico 1 (laag) 1 NA
36 Active part Wikkelingenset Wikkelingenset Risico 1 (laag) 1 NA
37 Secondairy assembly Complete transformator Secundaire installatie Risico 3 ( hoog) 1 NA
38 Warehouse Complete transformator Niet transformator gerelateerd Risico 2 (midden) 1 NA
39 Warehouse Complete transformator Kastwand Risico 2 (midden) 1 NA
40 Final assembly Complete kast Kastbodem (altijd onderzijde) Risico 3 ( hoog) 1 NA
41 Warehouse Complete transformator Niet transformator gerelateerd Risico 3 ( hoog) 1 NA
42 Warehouse Complete transformator Niet transformator gerelateerd Risico 3 ( hoog) 1 NA
43 Spoelenmontage Wikkeling Wikkeling Risico 1 (laag) 1 NA
44 Sales & projects Complete transformator Complete transformator Risico 3 ( hoog) 1 NA
45 Active part Binnenwerk Actief deel Risico 1 (laag) 1 NA
46 KAM Complete transformator Complete transformator Risico 2 (midden) 1 NA
47 Windingshop Wikkeling Wikkeling Risico 1 (laag) 1 NA
48 Sales & projects Complete transformator Complete transformator Risico 1 (laag) 1 NA
49 Active part Binnenwerk Actief deel Risico 1 (laag) 1 NA
50 Pre assembly Complete kast Koeling Risico 3 ( hoog) 1 NA
这是我使用的代码:
aggregate(count ~., test2, sum)
这是我得到的结果:
Afdeling_1 Probleemgebied Locatie.niveau.1 Risico cost count
1 Active part Wikkelingenset Wikkelingenset Risico 2 (midden) 1407.36 1
2 Active part Kern Kern Risico 3 ( hoog) 1820.00 1
我发现潜在的问题不是聚合不起作用,而是成本列有NA,并且数据只汇总到有成本的记录。因此,我需要一种不遗漏NA的方法。