因此,我要删除资产少于100个(销售)或销售额少于100个销售,或者如果emp,sale或at缺少价值的行。
然后,我想查找在2010年至2013年(含当年)(f年)内任何时间列出的美国每家公司的平均就业(emp)。
只要公司在该时间段内完全列出,我都希望将其包括在计算中。即使在2010年至2013年之间连续一年,我如何保留整个小组呢?
唯一的公司标识符是gvkey。
这就是我现在拥有的:
companies_q_three <- companies %>%
filter(at >= 100 | sale >= 100) %>%
filter(!is.na(sale), !is.na(emp), !is.na(at)) %>%
filter (loc == "USA") %>%
group_by(gvkey) %>%
filter(fyear >= 2010 & fyear <= 2013) %>%
summarise(companies_q_three = mean(emp, na.rm=TRUE))