什么样的神经网络架构对这类数据有好处?

时间:2018-03-03 17:49:05

标签: machine-learning neural-network deep-learning artificial-intelligence

This is where data comes from and what is the expected output

在我的测试数据集中,A的半径约为0.5,X,Y的范围约为[0..10],A位于x = 9 y = 3

我生成了50K样本,其中10%是正数,并且找不到NN不会过度拟合的方法,并且在验证数据集上产生了一些合理的东西。我只尝试过密集的架构。

我知道输入乘法(解决图像上的方程所需)不是标准密集层的一部分,但可以通过足够深的架构来实现。值得吗?或者我应该编写自己的图层(向量乘法)?分裂怎么样?

对NN来说这是一项好任务吗?也许有更好的输入数据编码? 如果没有,什么是数据挖掘/机器学习领域的合适方法?

理想情况下,这是检测输入数据中隐藏变量依赖关系的任务,它们可能很容易是非线性的(例如,3个点定义样条,让“假设2是最大功率”)和噪声(例如,可能有20个当只有大约4个点形成交叉线时(所有数据集中相同的4个点,例如第1个,第3个,第9个和第10个),Yi = 1.0,即Yi = 1.0)。我在哪里看?我问的太多了?

1 个答案:

答案 0 :(得分:0)

对于NN来说,这应该是一项简单的任务。我认为这里的关键问题是防止过度拟合。鼓励首先过度使用任务,然后解决烦恼问题。

处理过度拟合

  1. 层数越少,每层的单位越少
  2. 常规化,例如dropout regularlization,L2 regularlization
  3. 数据增加(基本上更多的训练数据)
  4. 提前停止(添加更好的停止标准)
  5. ...