最大限度地减少tensorflow.js中前馈神经网络的损失

时间:2019-05-07 06:30:00

标签: tensorflow machine-learning linear-regression tensorflow.js

我试图使用最初的少量数据集(仅适用于POC)在tensorflow.js中创建示例前馈神经网络。有5个输入节点和1个输出节点。数据与有多个输入的房屋有关,我们正在预测价格。

x_train:
[ [ 79545.45857, 5.682861322, 7.009188143, 4.09, 23086.8005 ],
  [ 79248.64245, 6.002899808, 6.730821019, 3.09, 40173.07217 ],
  [ 61287.06718, 5.86588984, 8.51272743, 5.13, 36882.1594 ],
  [ 63345.24005, 7.188236095, 5.586728665, 3.26, 34310.24283 ],
  [ 59982.19723, 5.040554523, 7.839387785, 4.23, 26354.10947 ],
...
] 

y_train
[ [ 1059033.558 ],
  [ 1505890.915 ],
  [ 1058987.988 ],
  [ 1260616.807 ],
  [ 630943.4893 ],
...
]

const model = tf.sequential();
const config_hidden = {
        inputShape: [5],
        activation: 'sigmoid',
        units: 6
    }

const config_output = {
    units: 1,
    activation: 'sigmoid'
}

const hidden = tf.layers.dense(config_hidden);
const output = tf.layers.dense(config_output);

model.add(hidden);
model.add(output);

const optimizer = tf.train.sgd(0.5);

const config = {
    optimizer: optimizer,
    loss: 'meanSquaredError',
    metrics: ['accuracy']
}

model.compile(config);

train_data().then(function () {
    console.log('Training is Complete');
}

async function train_data() {
    const options = {
        shuffle: true,
        epochs: 10,
        batch_size: 100,
        validationSplit: 0.1
    }

    for (let i = 0; i < 10; i++) {
        const res = await model.fit(xs, ys, options);
        console.log(res.history.loss[0]);
    }
}

模型编译良好。但是训练模型时损失巨大

Model Successfully Compiled
Epoch 1 / 10
eta=0.0 ====================================================================>
1058ms 235us/step - acc=0.00 loss=1648912629760.00 val_acc=0.00 val_loss=1586459705344.00
Epoch 2 / 10
eta=0.0 ====================================================================>
700ms 156us/step - acc=0.00 loss=1648913285120.00 val_acc=0.00 val_loss=1586459705344.00
Epoch 3 / 10
eta=0.0 ====================================================================>
615ms 137us/step - acc=0.00 loss=1648913022976.00 val_acc=0.00 val_loss=1586459705344.00
Epoch 4 / 10
eta=0.0 ====================================================================>
852ms 189us/step - acc=0.00 loss=1648913285120.00 val_acc=0.00 val_loss=1586459705344.00

我认为这可能是因为训练数据未标准化。所以我取了数据的平均值并将其除以

xs = xs.div(xs.mean(0));

x_train
[[1.1598413, 0.9507535, 1.003062 , 1.0272969, 0.6384002],
     [1.1555134, 1.0042965, 0.9632258, 0.7761241, 1.1108726],
     [0.8936182, 0.9813745, 1.2182286, 1.2885166, 1.0198718],
     ...,

损失没有太大变化

Model Successfully Compiled
Epoch 1 / 10
eta=0.0 ====================================================================>
841ms 187us/step - acc=0.00 loss=1648912760832.00 val_acc=0.00 val_loss=1586459705344.00
Epoch 2 / 10
eta=0.0 ====================================================================>
613ms 136us/step - acc=0.00 loss=1648913154048.00 val_acc=0.00 val_loss=1586459705344.00
Epoch 3 / 10
eta=0.0 ====================================================================>
646ms 144us/step - acc=0.00 loss=1648913022976.00 val_acc=0.00 val_loss=1586459705344.00

然后我也将输出标准化了

ys = ys.div(1000000);

Model Successfully Compiled
Epoch 1 / 10
eta=0.0 ====================================================================>
899ms 200us/step - acc=0.00 loss=0.202 val_acc=0.00 val_loss=0.161
Epoch 2 / 10
eta=0.0 ====================================================================>
667ms 148us/step - acc=0.00 loss=0.183 val_acc=0.00 val_loss=0.160
Epoch 3 / 10
eta=0.0 ====================================================================>
609ms 135us/step - acc=0.00 loss=0.182 val_acc=0.00 val_loss=0.159

这使损失降到了十进制数字。但是,可以看出,即使在训练数据上运行10000次迭代也不会显着减少损失。例如

Epoch 8 / 10
eta=0.0 ====================================================================>
502ms 112us/step - acc=0.00 loss=0.181 val_acc=0.00 val_loss=0.158
Epoch 9 / 10
eta=0.0 ====================================================================>
551ms 122us/step - acc=0.00 loss=0.181 val_acc=0.00 val_loss=0.158
Epoch 10 / 10
eta=0.0 ====================================================================>
470ms 104us/step - acc=0.00 loss=0.181 val_acc=0.00 val_loss=0.158
0.18076679110527039

最后,损失从0.202左右开始,下降到0.180左右。这会导致错误的预测。

这是一个非常常见的情况。值在不同范围内的多个输入(例如,上面使用的房屋数据)。多个输入传递到前馈神经网络。预期只有一个输出(在这种情况下为价格)。

问题: 1.上面的代码中我在做什么错? 2.我是否以正确的方式规范化了数据? 3.我是否使用了正确的损失函数/优化器/学习率/激活等? 4.我怎么知道模型表现良好 5.在tensorflow.js中还有其他方法吗?

1 个答案:

答案 0 :(得分:1)

由于S形激活,我将假设您不尝试线性回归。如果您尝试线性回归,请在所有位置删除S型激活。将尝试解决我可以看到的所有错误:

  1. 从输出中删除S型激活。乙状结肠函数将输入压缩为0到1,因此它并不用于回归。您的最后一层不需要激活。

  2. 您的学习率太高了,因此我怀疑学习算法是否可以收敛。从大约0.001-0.01等开始,并根据需要进行调整。

  3. 否,您的标准化不正确。通常,将数据归一化为平均值为零,标准差为1。这是针对每个要素列完成的,仅使用该列的均值和标准差,而不使用所有数据。功能列ix的公式如下:(x_i - x.mean()) / x.std()。 (我不懂javascript)

  4. 您提供的性能指标“准确性”是用于分类而不是回归,并且毫无意义(即使提供了)。最小化均方误差或绝对均方误差是量化模型性能的最佳方法。