我有一个数据集,其中包含一百万个特定顺序的值。问题在于,由于每个订单在行中都有多个日期,因此值重复。我想连续显示一个订单的所有更改日期,而不是多行显示。
我尝试在Python中使用pivovt,在PowerBI中使用Pivot。 PowerBI中的数据透视表确实将日期转换为列(但作为标题)。此外,它不会删除重复项。取而代之的是,每列显示为0。
我想要这样的东西: Link
答案 0 :(得分:0)
使用R表示方法。
library(tidyverse)
df1 = df %>% select(-Delivery_Date) %>%
group_by(GR_Key) %>%
mutate(GroupOrder = seq(n())) %>% # Create row order
spread(GroupOrder, Customer_Need_Date, sep="_")
df2 = df %>% select(-Customer_Need_Date) %>%
group_by(GR_Key) %>%
mutate(GroupOrder = seq(n())) %>%
spread(GroupOrder, Delivery_Date, sep="_")
df_final = df1 %>%
left_join(df2, by="GR_Key")
现在,这应该可以满足您的需求