在数据科学中应用算法的过程中,我们需要对输入数据集进行特征缩放。我想知道它是否是强制步骤,还是有任何技术决定执行特征缩放
1)数据可视化 2)统计值
答案 0 :(得分:0)
如果您的输入具有广泛的变化范围,则需要进行特征缩放,如果它们已经标准化,则您不需要它。 没有准确的规则可循。作为一项基本规则,请考虑标准化输入比非标准化输入更好。
答案 1 :(得分:0)
如果您创建一个具有两个数字特征的模型,并假设其中一个具有较高的值,例如工资(例如2345,1756,34521等),并且其中一个具有较低的值,如年龄,(例如33,17,29等)。显然,具有更高值的数字特征将对模型产生明显的影响。
为了避免这种情况,我们应该将两个特征扩展到相同的级别并进行建模。
这取决于您用于构建模型的算法。只有少数模型需要功能扩展,而不是全部。