我正在尝试使用das-ml中的QuantileTransformer
为此,我有以下DF:
当我尝试:
从dask_ml.preprocessing导入StandardScaler,QuantileTransformer,MinMaxScaler
scaler = QuantileTransformer()
scaler.fit_transform(df[['LotFrontage','LotArea']])
我收到此错误:
ValueError:试图连接形状未知的数组(1,nan)。 要强制进行串联,请通过allow_unknown_chunksizes = True。
我找不到在哪里设置参数:allow_unknown_chunksizes = True 由于在变压器中引发和错误。
如果我事先计算df,第一个错误就会消失:
scaler = QuantileTransformer()
scaler.fit_transform(df[['LotFrontage','LotArea']].compute())
但是我不为什么这样做是必要的,即使这样做是正确的。 另外,与StandardScaler相比,它返回的是数组而不是数据帧。