如何处理Azure Machine Learning Studio中的缺失值

时间:2018-01-04 01:15:41

标签: azure machine-learning azure-machine-learning-studio ml-studio

根据统计数据,我看起来有672个任务值。 QuotedPremium列中有NULL值。

enter image description here

我实现了Clean Missing Data模块,它应该用0替换缺失值,但由于某种原因,我仍然看到NULL值为QuotedPremium,但是...它表示缺少的值是= 0

enter image description here

enter image description here

在这里你看到它告诉我缺少值= 0,但仍然有NULL

enter image description here

那么在我运行Clean Missing Data模块后发生了什么?为什么它成功运行但仍有NULL值,即使它告诉缺失值的数量为0。

2 个答案:

答案 0 :(得分:2)

NULL确实是一个价值;包含NULL的条目缺失,因此它们既不会被“清除缺失数据”运算符清除也不会报告为丢失。

答案 1 :(得分:0)

由于它们并不是真正缺少值,因此将其字符串NULL添加到所有这些单元格中。因此,为了将这些值替换为0,您可以在下面使用它:

使用Execute R Script模块,并在其中添加此代码。

dataset1 <- maml.mapInputPort(1); # class: data.frame
dataset1[dataset1 == "NULL"] = 0; # Wherever cell's value is "NULL", replace it with 0
maml.mapOutputPort("dataset1"); # return the modified data.frame

相同图片:

enter image description here