我的数据框有多个字段,其中两个字段为CUST_NAME
和DATE_OF_PURCHASE
。
我必须找到每个客户的任期。为此我想找到每个客户的第一笔交易,然后找到当天和今天之间的日子。然后我必须在他们的交易之间找到平均天数。
我目前按升序对日期字段进行排序,找到唯一的客户名称。然后按唯一客户名称搜索总数据帧。
但是,我只获得一个客户的数据。谁能解释为什么我只得到一个结果?
以下是数据样本:
CUSTOMER_MAILID TRX_DATE
0 0007ayan@gmail.com 21/04/2013
1 0007ayan@gmail.com 12/05/2013
2 000.tushar@gmail.com 18/05/2013
3 0007ayan@gmail.com 03/06/2013
4 0007ayan@gmail.com 15/06/2013
5 0007ayan@gmail.com 30/06/2013
6 0007ayan@gmail.com 10/07/2013
7 0007ayan@gmail.com 23/07/2013
8 000.tushar@gmail.com 07/12/2013
9 0007ayan@gmail.com 19/12/2013
10 00078r@gmail.com 22/01/2014
11 00078r@gmail.com 16/02/2014
12 00078r@gmail.com 01/03/2014
13 00078r@gmail.com 01/03/2014
14 00078r@gmail.com 01/03/2014
15 00078r@gmail.com 07/03/2014
16 00078r@gmail.com 08/03/2014
17 00078r@gmail.com 06/04/2014
18 00078r@gmail.com 11/04/2014
这是我的代码:
df.sort(['TRX_DATE'],ascending=True,inplace=True)
df_unique_cust = df['CUSTOMER_MAILID'].unique()
for df_unique_cust in df['CUSTOMER_MAILID']:
df_pair = df[df.CUSTOMER_MAILID == df_unique_cust]