我在Category
(例如巧克力),Brand
(例如吉百利)和Week
(1-208)之后订购了以下每周零售数据的数据集。 CBX
是每个品牌的唯一全局标识符。
Category Brand Week Sales Price CBX
33 2 1 167650. 2.20 33 - 2
33 2 2 168044. 2.18 33 - 2
33 2 3 160770 2.24 33 - 2
我现在想要删除超过75%的销售额为零的品牌(因此至少156周内销售额为正)。
起初,我使用dplyr
删除了所有零销售的品牌,但它删除了太多的数据。这是我使用的代码:
library(dplyr)
Final_df_ <- Final_df %>%
group_by(Final_df$CBX) %>%
filter(!any(Sales==0 & Price==0))
现在我正在尝试更改代码,以便只删除属于品牌(CBX
)的所有行,如果该品牌的销售额在超过25%的情况下为零。
这是我走了多远:
Final_df_ <- Final_df %>%
group_by(Final_df$CBX) %>%
filter(!((Final_df$Sales==0)>0.75))
谢谢!