使用implemented one数据集和TensorFlow观看视频并阅读Neural Networks
我MNIST上的一些教程。
现在我写了(my own)
非常简单的库; 4个类,我想在GTSD数据集
我意识到任务的复杂性,但它是为了学习目的并巩固思想,而不仅仅是学习TensorFlow
语法
在MNIST数据集中,有784
个输入,图像中每个像素一个。
GTSD中的交通标志有不同的形状,所以我有一个跟随这个伪代码的想法
1) Read sample image files per classification type
2) Determine largest rows,cols for classification type
3) Zero-fill smaller samples to match largest shape
关于numpy.pad如何做到这一点,我遇到了一些麻烦。
说出包含114
行的图片和另一张包含122
列的图片,我确定这些是max
行和列。如果有另一张图像(36, 42)
我如何填充这个(114,122)
形状?
最后是填充可以解决每个输入的可变特征长度问题的唯一步骤吗?