我已经阅读了许多其他类似问题的帖子,但大多数答案似乎都是一个“艺术”,这可能适用于任意图像,因为我们不确切知道哪些功能和多少功能学到了。但如果我们已经知道我们希望CNN学习的功能,我们可以做出有根据的猜测吗?
例如,在tic-tac-toe(noughts and crosses)游戏中,我们知道我们正在寻找2像素深的直线和我们的移动最终占据中心或角落位置的位置(让我们忽略)现在任何其他功能)。因此,我们可以将理想的特征映射大小计算如下 -
2(2条斜线)+ 1条(1条垂直线)+ 1条(1条水平线)+ 1条(中心位置)+ 4条(角落位置)= 9张特征图?
我对特征图的理解是否正确?
注意:我正在使用tic-tac-toe(noughts和crosses)作为学习CNN编程的一个非常简单的例子。我对特征图的理解(如果错误,请随意纠正)是它们对应于线条,曲线等实际特征(至少在第一层)。