使用dask QuantileTransformer的ValueError:未知形状(1,nan)

时间:2019-07-15 23:23:35

标签: python dask

我正在尝试使用das-ml中的QuantileTransformer

为此,我有以下DF:

enter image description here

当我尝试:

从dask_ml.preprocessing导入StandardScaler,QuantileTransformer,MinMaxScaler

scaler = QuantileTransformer()
scaler.fit_transform(df[['LotFrontage','LotArea']])

我收到此错误:

  

ValueError:试图连接形状未知的数组(1,nan)。   要强制进行串联,请通过allow_unknown_chunksizes = True。

我找不到在哪里设置参数:allow_unknown_chunksizes = True 由于在变压器中引发和错误。

如果我事先计算df,第一个错误就会消失:

scaler = QuantileTransformer()
scaler.fit_transform(df[['LotFrontage','LotArea']].compute())

但是我不为什么这样做是必要的,即使这样做是正确的。 另外,与StandardScaler相比,它返回​​的是数组而不是数据帧。

1 个答案:

答案 0 :(得分:1)

这是以前的Dask-ML实现的局限性。它已在https://github.com/dask/dask-ml/pull/533中修复。