标签: apache-spark pyspark apache-spark-sql categorical-data encoder
我想使用PySpark中的均值(目标)编码器对Spark数据帧(df)的分类特征进行编码。您是否知道是否有适用于此的构建方案?
*我知道已经存在一些用于对pandas数据帧进行编码的软件包,但是我不想将我的数据帧转换为pandas。