洁牙机对PySpark中分类列的影响

时间:2019-01-19 11:20:44

标签: encoding pyspark standardized

当我查看PySpark ml实现时,我看到了将这些特征组合成矢量后应用的标准化缩放器。但是,我的组合特征向量由一些被索引的特征(分类类型)组成。

  1. 定标器也会转换类别特征吗?还是因为元数据而忽略它?
  2. 如果要对分类要素进行缩放,是否应将标准化应用于适当的列,然后将这些列组合成特征向量?

0 个答案:

没有答案