我完成了两门神经网络课程,并完成了有关该主题的大量阅读。我对Tensorflow和Keras感到满意,并建立了先进的神经网络(多输入,大数据,特殊层......)。我对基础数学也有相当深刻的理解。
我的问题是我知道如何建立神经网络,但不知道“专家”为特定应用创建一个神经网络的过程。
我可以:
我缺少的是如何在神经网络中提出各层(多宽,多少......)。我知道这有点反复试验,看看对别人有用的东西。但是必须有一个人们可以使用的过程来提出实际上非常好的架构*。例如,最先进的神经网络。
我正在寻找一个免费的资源,可以帮助我理解创建一个非常好的架构的过程*。
* by architecture我指的是构成网络的不同层及其属性
答案 0 :(得分:1)
我写了关于这个主题的硕士论文:
托马,马丁。 " Analysis and Optimization of Convolutional Neural Network Architectures&#34。 arXiv preprint arXiv:1707.09725(2017)。
长话短说:有几种分析技术(第2.5章)和学习拓扑的算法(第3章),但在实践中,它主要是试验和错误/直觉。