为实际应用找到良好的神经网络架构的资源

时间:2018-04-11 21:37:41

标签: neural-network artificial-intelligence

我完成了两门神经网络课程,并完成了有关该主题的大量阅读。我对Tensorflow和Keras感到满意,并建立了先进的神经网络(多输入,大数据,特殊层......)。我对基础数学也有相当深刻的理解。

我的问题是我知道如何建立神经网络,但不知道“专家”为特定应用创建一个神经网络的过程。

我可以:

  • 收集大量数据并进行清理。
  • 训练神经网络。
  • 微调超级参数。
  • 将其导出为实际应用程序。

我缺少的是如何在神经网络中提出各层(多宽,多少......)。我知道这有点反复试验,看看对别人有用的东西。但是必须有一个人们可以使用的过程来提出实际上非常好的架构*。例如,最先进的神经网络。

我正在寻找一个免费的资源,可以帮助我理解创建一个非常好的架构的过程*。

* by architecture我指的是构成网络的不同层及其属性

1 个答案:

答案 0 :(得分:1)

我写了关于这个主题的硕士论文:

  托马,马丁。 " Analysis and Optimization of Convolutional Neural Network Architectures&#34。 arXiv preprint arXiv:1707.09725(2017)。

长话短说:有几种分析技术(第2.5章)和学习拓扑的算法(第3章),但在实践中,它主要是试验和错误/直觉。