假设我想制作一个可以做某事的模型。现在,当我在谷歌或YouTube上搜索主题时,我发现许多相关的教程,似乎有些聪明的程序员已经使用深度学习实现了该模型。
但他们如何知道使用深度学习解决某些问题需要什么类型的层,什么类型的激活函数,损失函数,优化器,单元数等。
是否有任何技术可以了解这一点,或仅仅是理解和体验的问题?如果有人能指出我回答我的问题的一些视频或文章,那将是非常有帮助的。
答案 0 :(得分:3)
这更多的是理解和经验。从头开始构建模型时,您必须了解哪个优化器,丢失等对您的特定问题有意义。为了正确选择这些,您必须了解可用优化器,损失函数等之间的差异。
关于选择多少层和节点,批量大小,学习率等等 - 这些都是超参数,您需要在试验模型时进行测试和调整。
我有Deep Learning Fundamentals YouTube playlist你可能会觉得有帮助。它涵盖了短视频中每个主题的基本基础知识。此外,如果您希望在获得基本概念后更多地关注编码,那么此Deep Learning with Keras playlist也可能会有所帮助。
答案 1 :(得分:1)
感谢您提出问题。