dask条件选择 - iloc缺失

时间:2017-05-19 06:26:32

标签: python dask

如何实施

df.loc[df.some_string_column == '', 'some_string_column'] = np.nan
在dask? Das似乎不支持使用bloc / loc索引器。我得到的错误是

TypeError: '_LocIndexer' object does not support item assignment

1 个答案:

答案 0 :(得分:4)

一般来说,在dask中,您必须使用赋值来创建新的数据帧,而不是改变现有的数据帧;虽然语法类似,但正在创建一个新的计算图。在您的情况下,这看起来像:

df['some_string_column'] = df.some_string_column.map(
    lambda x: x if x else np.nan))

df['some_string_column'] = df.some_string_column.where(
    df.some_string_column != '', np.nan)