Question

我有一个数据框：

DF

Date_1      Date_2      b_count
01/09/2019  02/08/2019  148
01/09/2019  03/08/2019  148
01/09/2019  04/08/2019  148
01/09/2019  05/08/2019  148
01/09/2019  06/08/2019  148
01/09/2019  07/08/2019  148
01/09/2019  08/08/2019  148
01/09/2019  09/08/2019  148
01/09/2019  10/08/2019  148
01/09/2019  11/08/2019  148
01/09/2019  12/08/2019  148
01/09/2019  13/08/2019  148
01/09/2019  14/08/2019  148
01/09/2019  15/08/2019  148
01/09/2019  16/08/2019  148
01/09/2019  17/08/2019  148
01/09/2019  18/08/2019  148
01/09/2019  19/08/2019  148
01/09/2019  20/08/2019  148
01/09/2019  21/08/2019  148
01/09/2019  22/08/2019  148
01/09/2019  23/08/2019  148
01/09/2019  24/08/2019  148
01/09/2019  25/08/2019  148
01/09/2019  26/08/2019  148
01/09/2019  27/08/2019  148
01/09/2019  28/08/2019  148
01/09/2019  29/08/2019  148
01/09/2019  30/08/2019  148
01/09/2019  31/08/2019  148

我想在数据框personal_count中生成另一列，该列将使用b_count的值（即148）创建，以使计数的60％位于最近10天，其余40％位于其余天。例如-这里date_1被重复30次，将148划分为30个条目，以使计数的60％位于date_2的最后10个日期中（在我们的情况下为22/08/2019到31/08/2019。

到目前为止，我能够使用来实现增长的趋势：

def add_series(grp):
   n_rows = grp.shape[0]
   val = grp['b_count'].min()
   s = np.exp(np.linspace(0,1,n_rows)) 
   s = np.round((s * val)/ np.sum(s))
   grp['individual_count'] = s
   return grp

df3 = joined_df.groupby('Date_1').apply(add_series)

这为我提供了personal_count分配的增长趋势，但是，我也想分配60-40的比率，

因此，想法是合并60-40的比例并消耗相应的完整计数。任何人都可以帮忙吗？

请注意-数据框已首先在Date_1上排序，然后在Date_2上排序。

谢谢

趋势中具有比率的数据框的生成

0 个答案: