我不熟悉在机器学习中扩展特征的概念,我read当一个特征范围与其他特征相比非常高时,缩放将非常有用。但如果我选择缩放训练数据,那么:
X
列车数据,那么我是否还需要缩放列车数据y
和整个测试数据?答案 0 :(得分:3)
答案 1 :(得分:0)
是的,您可以缩放单个功能。您可以将缩放解释为对每个要素赋予相同重要性的方法。例如,假设您有关于人的数据,并且您通过两个功能描述您的示例:身高和体重。如果您以千米为单位测量身高,以千克为单位测量体重,则在计算两个示例之间的距离时,k-Nearest Neighbors分类器可能仅根据权重做出决策。在这种情况下,您可以将其中一个功能扩展到另一个功能的相同范围。通常,我们将所有要素缩放到相同范围(例如0 - 1)。此外,请记住,必须使用用于扩展训练数据的所有值来缩放测试数据。
至于因变量y
,您无需缩放它。