Question

我有一个数据集，其中包含一百万个特定顺序的值。问题在于，由于每个订单在行中都有多个日期，因此值重复。我想连续显示一个订单的所有更改日期，而不是多行显示。

我尝试在Python中使用pivovt，在PowerBI中使用Pivot。 PowerBI中的数据透视表确实将日期转换为列（但作为标题）。此外，它不会删除重复项。取而代之的是，每列显示为0。

我想要这样的东西： Link

Answer 1

使用R表示方法。

library(tidyverse)

df1 = df %>% select(-Delivery_Date) %>% 
  group_by(GR_Key) %>% 
  mutate(GroupOrder = seq(n())) %>% # Create row order
  spread(GroupOrder, Customer_Need_Date, sep="_") 

df2 = df %>% select(-Customer_Need_Date) %>% 
  group_by(GR_Key) %>% 
  mutate(GroupOrder = seq(n())) %>% 
  spread(GroupOrder, Delivery_Date, sep="_")

df_final = df1 %>%
  left_join(df2, by="GR_Key")

现在，这应该可以满足您的需求

将多个日期行转换为Python / R / PowerBI中的列？

1 个答案: