初学者回归的基本概念(机器学习)

时间:2020-03-24 09:30:26

标签: python machine-learning neural-network regression linear-regression

我是机器学习的新手。如果问题看起来有些混乱,我深表歉意。这个框架(https://codesandbox.io/s/transition-group-u5htd)应用神经网络来解决回归问题,我有几个问题。

https://www.tensorflow.org/tutorials/keras/regression

数据集的尾部如上所示。最后三列使用的是一键编码。

dataset tail

数据检查如上所示。问题1)为什么我们需要这样做?

Question 1

检查后,它将标签上的特征分开。问题2)我了解回归中的概念y = mx1 + mx2 + ... + c。我们有MPG,汽缸,排量,马力等作为特征(x1,x2,x3,x4 ...),但数据集中没有标签(y)。在这种情况下,我们应该如何进行监督培训? “将标签与要素分开”是什么意思?

非常感谢您阅读此问题!

1 个答案:

答案 0 :(得分:1)

标签

标签是数据的预期内容。
就您而言,您的标签似乎是MPG,因此您正在从数据中学习MPG。
对象#1的MPG为27,对象#2的MPG为44,等等。

功能

特征是数据:
对象#1可以是具有以下条目的矩阵:{0,1; 1,0},对象#2可以是具有以下条目的矩阵:{1,1; 1,0},等等。

请注意,标签和要素在代码中可以具有不同类型的表示形式。了解概念上的差异很重要。

功能和标签之间的连接

您希望算法学习类似的矩阵具有一定的MPG,而看起来稍有不同的矩阵具有另一个MPG。

为此,您需要将标签(对象类型,在此情况下为MPG)与功能(对象本身,在此情况下为每个对象的数据,不包括MPG)分开,以便学习和预测数据中的MPG。