标签: python apache-spark pyspark spark-dataframe
有一个名为pyspark.ml.feature的模块,其中有一个名为MinMaxScaler的类。其文件声称:
pyspark.ml.feature
MinMaxScaler
将每个功能单独重新调整为常用范围[min,max] 线性使用列摘要统计信息,也称为 min-max归一化或重新缩放。
因此我可以使用它来规范化我的数据集,这就是我所做的。我的问题是当我试图回到它的非规范化形式时。我已阅读documentation,但无法找到与此相关的任何内容。