我有一个DataFrame,从中可以创建一个新的计算列。然后,我使用df.fillna(0.0)
确保没有NaN值。
df = pd.read_csv("my_data.csv")
df['units_per_month'] = df['units'] / df['months_since_first_order']
df = df.fillna(0.0)
然后我按类别df_grp = df.groupby(['segments'])
对DataFrame进行分组,并尝试计算标准偏差std_units_month = df_grp['units_per_month'].std()
这对于我的11个类别中的8个完全正常,但是对于其中3个类别,std返回为NaN
我知道我拥有所有有效值,并且所有NaN
值都已填充,因为df[['segments','units_per_month']][df['units_per_month'].isnull()]
返回了一个空的DataFrame。
我还下载了所有数据,并确认没有问题。.excel可以计算所有stdev。.
对我可能在哪里出错有任何想法吗?