Pyspark:类别特征的均值(目标)编码spark dataFrame

时间:2018-09-20 15:14:06

标签: apache-spark pyspark apache-spark-sql categorical-data encoder

我想使用PySpark中的均值(目标)编码器对Spark数据帧(df)的分类特征进行编码。您是否知道是否有适用于此的构建方案?

*我知道已经存在一些用于对pandas数据帧进行编码的软件包,但是我不想将我的数据帧转换为pandas。

0 个答案:

没有答案