蜂巢中的数据集标准化

时间:2015-03-25 11:07:00

标签: hadoop hive

我需要进行数据标准化,即将我的数据集转换为平均值0和标准差1的列。我的数据存在于配置单元中。在hive中是否存在任何可以为我做同样的函数,例如R中的scale(dataset)。

1 个答案:

答案 0 :(得分:1)

就像我所知道的那样,对于这样的操作,没有Hive等效物。您可以查看Hive operators and User-Defined Functions的此列表。如果不存在,您可以创建关于所需操作的自己的UDF;它在链接的末尾描述。