我正在尝试得出图像分类中权重矩阵的几何解释。
为简单起见,假设数据集由每个图像包含2个像素和2个标签(类)组成。
然后,我们将能够在x-y笛卡尔坐标上可视化这两个类。
从斯坦福大学CS231N讲座上
线性分类器的形式为s = W * x + b
其中s是2x1得分向量,W是2x2权重矩阵,x是2x1输入向量,b是2x1偏差向量。
然后,我们可以从W * x + b = 0
中得出两行的两个方程。
据说它们是每个班级的决策边界。
为什么会有“两个”决策边界,
我们只需要一个边界就可以对两个类别进行分类?
W * x + b = 0
中的每个方程应如何进行几何解释?
谢谢。