我的数据框中有一组列,我希望将NaN值用0表示。例如
mylist = ['col1', 'col2','col3','col4', 'col5']
df[mylist] = df[mylist].fillna(0)
这实际上在我的应用程序中占用了大量时间,我想知道是否有更快的方法来实现这一目标。
答案 0 :(得分:0)
基本上,对于任何看这个的人。如果您正在构建一个应该运行得非常快的应用程序(例如近实时机器学习预测),则根本不应该使用pandas
答案 1 :(得分:-1)
所以事实证明循环遍及我的列并使用numpy更快
for col in mylist:
df[col] = np.nan_to_num(df[col].values)