我这样有一个data.frame:
cod year city pmat
1 110001 1998 ALTA FLORESTA D OESTE NA
2 110001 1999 ALTA FLORESTA D OESTE NA
3 110001 2000 ALTA FLORESTA D OESTE NA
4 110001 2001 ALTA FLORESTA D OESTE NA
5 110001 2002 ALTA FLORESTA D OESTE NA
6 110001 2003 ALTA FLORESTA D'OESTE NA
7 110001 2004 ALTA FLORESTA D OESTE NA
8 110001 2005 ALTA FLORESTA D OESTE NA
9 110001 2006 ALTA FLORESTA D OESTE NA
10 110001 2007 ALTA FLORESTA D OESTE NA
11 110001 2008 ALTA FLORESTA D OESTE NA
12 110001 2009 ALTA FLORESTA D OESTE NA
13 110001 2010 ALTA FLORESTA D OESTE NA
14 110001 2011 ALTA FLORESTA D OESTE NA
15 110001 2012 ALTA FLORESTA D OESTE NA
16 110001 2013 ALTA FLORESTA D OESTE NA
17 110001 2014 ALTA FLORESTA D OESTE NA
18 110001 2015 ALTA FLORESTA D OESTE NA
19 110001 2016 ALTA FLORESTA D OESTE NA
20 110002 1998 ARIQUEMES 0
21 110002 1999 ARIQUEMES 0
22 110002 2000 ARIQUEMES 0
23 110002 2001 ARIQUEMES 0
24 110002 2002 ARIQUEMES 0
25 110002 2003 ARIQUEMES 0
26 110002 2004 ARIQUEMES 1
27 110002 2005 ARIQUEMES 1
28 110002 2006 ARIQUEMES 1
29 110002 2007 ARIQUEMES 1
30 110002 2008 ARIQUEMES 1
31 110002 2009 ARIQUEMES 1
32 110002 2010 ARIQUEMES 1
33 110002 2011 ARIQUEMES 1
34 110002 2012 ARIQUEMES 1
35 110002 2013 ARIQUEMES 1
36 110002 2014 1
37 110002 2015 ARIQUEMES 1
38 110002 2016 ARIQUEMES 1
39 110003 1998 CABIXI NA
40 110003 1999 CABIXI NA
41 110003 2000 CABIXI NA
42 110003 2001 CABIXI NA
43 110003 2002 CABIXI NA
44 110003 2003 CABIXI NA
45 110003 2004 CABIXI NA
46 110003 2005 CABIXI NA
47 110003 2006 CABIXI NA
48 110003 2007 CABIXI NA
49 110003 2008 CABIXI NA
50 110003 2009 CABIXI NA
我想创建一个名为“ ano_contrat1”的变量,如果该城市在任何一年中的pmat值等于1,则该新变量将成为pmat == 1的第一年,在所分析的所有时间段内均保持不变,就像在我创建的示例中一样,查看城市ARQUIMEDES(如果pmat始终为0,则城市的变量将为0):
cod ano MUNICIPIO pmat ano_contrat1
1 110001 1998 ALTA FLORESTA D OESTE NA 0
2 110001 1999 ALTA FLORESTA D OESTE NA 0
3 110001 2000 ALTA FLORESTA D OESTE NA 0
4 110001 2001 ALTA FLORESTA D OESTE NA 0
5 110001 2002 ALTA FLORESTA D OESTE NA 0
6 110001 2003 ALTA FLORESTA D'OESTE NA 0
7 110001 2004 ALTA FLORESTA D OESTE NA 0
8 110001 2005 ALTA FLORESTA D OESTE NA 0
9 110001 2006 ALTA FLORESTA D OESTE NA 0
10 110001 2007 ALTA FLORESTA D OESTE NA 0
11 110001 2008 ALTA FLORESTA D OESTE NA 0
12 110001 2009 ALTA FLORESTA D OESTE NA 0
13 110001 2010 ALTA FLORESTA D OESTE NA 0
14 110001 2011 ALTA FLORESTA D OESTE NA 0
15 110001 2012 ALTA FLORESTA D OESTE NA 0
16 110001 2013 ALTA FLORESTA D OESTE NA 0
17 110001 2014 ALTA FLORESTA D OESTE NA 0
18 110001 2015 ALTA FLORESTA D OESTE NA 0
19 110001 2016 ALTA FLORESTA D OESTE NA 0
20 110002 1998 ARIQUEMES 0 2004
21 110002 1999 ARIQUEMES 0 2004
22 110002 2000 ARIQUEMES 0 2004
23 110002 2001 ARIQUEMES 0 2004
24 110002 2002 ARIQUEMES 0 2004
25 110002 2003 ARIQUEMES 0 2004
26 110002 2004 ARIQUEMES 1 2004
27 110002 2005 ARIQUEMES 1 2004
28 110002 2006 ARIQUEMES 1 2004
29 110002 2007 ARIQUEMES 1 2004
30 110002 2008 ARIQUEMES 1 2004
31 110002 2009 ARIQUEMES 1 2004
32 110002 2010 ARIQUEMES 1 2004
33 110002 2011 ARIQUEMES 1 2004
34 110002 2012 ARIQUEMES 1 2004
35 110002 2013 ARIQUEMES 1 2004
36 110002 2014 1 2004
37 110002 2015 ARIQUEMES 1 2004
38 110002 2016 ARIQUEMES 1 2004
39 110003 1998 CABIXI NA 0
40 110003 1999 CABIXI NA 0
41 110003 2000 CABIXI NA 0
42 110003 2001 CABIXI NA 0
43 110003 2002 CABIXI NA 0
44 110003 2003 CABIXI NA 0
45 110003 2004 CABIXI NA 0
46 110003 2005 CABIXI NA 0
47 110003 2006 CABIXI NA 0
48 110003 2007 CABIXI NA 0
49 110003 2008 CABIXI NA 0
50 110003 2009 CABIXI NA 0
我尝试使用ifelse,但是没有用。你能帮助我吗?谢谢
答案 0 :(得分:0)
这是使用dplyr::first
的解决方案,该解决方案在第一年的pmat == 1
library(dplyr)
df %>% group_by(city) %>% mutate(ano_contrat1 = first(year[pmat==1]))
#Get the required output
df %>% group_by(city) %>% mutate(ano_contrat1 = ifelse(is.na(pmat), 0, first(year[pmat==1])))