fillNa(0)而不产生None

时间:2018-09-21 19:38:32

标签: pandas fillna

我的问题就在下面的代码段中:

我有原始的传感器时间序列数据,这些数据现在已经非常接近可用了:)

enter image description here

locDf = locationDf.copy()
locDf.set_index('date', inplace=True)

locDfs = {}
for user, user_loc_dc in locDf.groupby('user'):
    locDfs[user] = user_loc_dc.resample('15T').agg('max').bfill()

aDf = appDf.copy()
aDf.set_index('date', inplace=True)

userLocAppDfs = {}
appDfs = []
for user, a2_df in aDf.groupby('user'):
    userDf = a2_df.resample('15T').agg('min')

    userDf.reset_index(inplace=True)
    userDf = pd.crosstab(index=userDf['date'], columns=userDf['app'], values=userDf['metric'], aggfunc=np.mean).fillna(0, downcast='infer')

    userDf['user'] = user

    userDf.reset_index(inplace=True)
    userDf.set_index('date', inplace=True)

    appDfs.append(userDf)
    userLocAppDfs[user] = userDf

    loDf = locDfs[user]
    loDf.reset_index(inplace=True)
    loDf = pd.crosstab([loDf.date, loDf.user], loDf.location)
    loDf.reset_index(inplace=True)

    loDf.set_index('date', inplace=True)
    loDf.drop('user', axis=1, inplace=True)

    userLocAppDfs[user] = userLocAppDfs[user].join(loDf, how='outer')
    userLocAppDfs[user]['user'].fillna(user, inplace=True)

    #for app in a2_df['app'].unique():
    #    userLocAppDfs[user][app] = userLocAppDfs[user][app].fillna(0, inplace=True)


userLocAppDfs['user_1'].head(5)

问题

如果我取消注释最后两行以尝试在开始时填充NaN,则我不会得到零。我。 :(谁能告诉我为什么?

None

我想..你知道的,在那里得到0:

2017-08-28 00:00:00 0   0   user_1  0.0 0.0 0.0 1.0 0.0
2017-08-28 00:15:00 0   0   user_1  0.0 0.0 1.0 0.0 0.0
2017-08-28 00:30:00 0   0   user_1  0.0 0.0 1.0 0.0 0.0
2017-08-28 00:45:00 0   0   user_1  0.0 0.0 1.0 0.0 0.0
2017-08-28 01:00:00 0   0   user_1  0.0 0.0 1.0 0.0 0.0

对我来说,最后一步是获取这些app_ *数字的滚动平均值,以便获得曲线。

1 个答案:

答案 0 :(得分:2)

尝试

for app in a2_df['app'].unique():
    userLocAppDfs[user][app].fillna(0, inplace=True)
    # or userLocAppDfs[user][app] = userLocAppDfs[user][app].fillna(0)

这是因为您指定了inplace = True,同时又将其分配了回来。

请注意,df.fillna(0, inplace=True)将不会返回值。而是直接修改原始的df。尝试print(df.fillna(0, inplace=True)),它将为您提供None。因此,您在上方所做的就是将None分配给列apps