是否有任何数据可视化技术会推荐我们进行功能扩展?

时间:2018-01-22 16:41:12

标签: data-science

在数据科学中应用算法的过程中,我们需要对输入数据集进行特征缩放。我想知道它是否是强制步骤,还是有任何技术决定执行特征缩放

1)数据可视化 2)统计值

2 个答案:

答案 0 :(得分:0)

如果您的输入具有广泛的变化范围,则需要进行特征缩放,如果它们已经标准化,则您不需要它。 没有准确的规则可循。作为一项基本规则,请考虑标准化输入比非标准化输入更好。

答案 1 :(得分:0)

如果您创建一个具有两个数字特征的模型,并假设其中一个具有较高的值,例如工资(例如2345,1756,34521等),并且其中一个具有较低的值,如年龄,(例如33,17,29等)。显然,具有更高值的数字特征将对模型产生明显的影响。

为了避免这种情况,我们应该将两个特征扩展到相同的级别并进行建模。

这取决于您用于构建模型的算法。只有少数模型需要功能扩展,而不是全部。