如何在神经网络训练中使用数据集

时间:2016-11-05 04:02:54

标签: machine-learning dataset neural-network computer-science backpropagation

我正在尝试实施神经网络。我目前正在研究反向传播部分。我不需要编码方面的帮助。到目前为止,我已经写了feedForward部分并取得了巨大的成功。但我的问题与我正在使用的数据集更相关。

这是我的数据集:

http://archive.ics.uci.edu/ml/machine-learning-databases/cpu-performance/machine.data

我必须使用5倍交叉验证来反向传播并停止训练,直到错误阈值为.1.01.001意味着我必须进行3次试验。忽略每个数据点的前2个点。我已经对该集进行了规范化。网络的体系结构是输入层中的7个神经元,1个隐藏层中的3个神经元和1个输出。非常基本的实施。

所以我的问题是,

  1. 我必须打破5个较小子集中的设置吗?保留一个用于测试和休息以进行验证和培训吗?

  2. 我训练多久?说我使用1折(每折约42个数据集),我达到了我想要的错误阈值。我会停下来吗?并使用测试数据?否则我加载下一组并继续训练?如果在达到所需的错误阈值之前我的数据集用完了怎么办?

  3. 我也应该遵循这样的事情吗?

    1. 使用输入值
    2. 前馈,然后比较错误
    3. 反向传播并调整权重
    4. 重复进程a-c,直到达到错误阈值并完成当前折叠中的所有数据?
  4. 谢谢你的时间和回应。我真的想了解如何使用数据集。一旦我编写代码,我会更新你们。

0 个答案:

没有答案