通过具有最小值,最大值,平均值和中值的列从现有数据帧组创建python数据帧

时间:2018-02-01 17:11:04

标签: python pandas dataframe missing-data data-extraction

这就是我的数据框架的样子。

   A      B    C
ice solid Kate ice solid Jake solid Jake tea liquid Lilly tea solid Jake liquid Kate tea liquid Apple ice liquid Apple
我想用A groupby B的“最常见”值填充A的缺失值 因此,iceB的值为solidtea的值为liquid@ofDate = '2/1/2018'的值为DECLARE @RC AS DATE, @ofDate AS DATE; SELECT @RC = NULL, @ofDate = '2/1/2018'; SELECT @RC = [dbo].[GetMostRecentThursday](@ofDate); SELECT @RC AS RC; 。 我怎样才能做到这一点。

1 个答案:

答案 0 :(得分:1)

这就是我解决它的方式。

df['A'] = df.groupby('Outlet_Type').A.transform(lambda x: x.fillna(x.mode()[0]))