我刚刚从this site学到了一些东西。我不明白,在这篇文章中,作者创建了2个标准缩放器对象sc_X = StandardScaler()
和sc_y = StandardScaler()
,将相同的Standard Scaler
分配给两个不同的变量sc_X
和sc_y
,并且为X
和y
分别分别使用每个。在上一行中,他创建了le_X = LabelEncoder()
,将LabelEncoder()
分配给一个变量le_X
,以在 X
和y
上使用。我不明白为什么他为同一功能创建两个变量以分别在 *每个 X
和y
上使用,然后创建一个变量同时用于 X
和y
。我现在很困惑。请有人解释为什么会这样
答案 0 :(得分:1)
LabelEncoder不需要从数据中提取信息即可工作,该程序只需在序列上运行并将目标值转换为数字即可。
StandardScale计算列的均值和方差以缩放它们。
看到这一点,x和y列可能具有2个不同的平均值和标准偏差,需要分别计算,这就是为什么它们创建2个对象的原因。