我从Youtube人脸数据集0中提取了约35.000个图像帧及其相应的界标。图像在单独的Numpy数组中具有(x, y)
坐标的68个对应地标。我想在数据上训练神经网络,并找到了一个有趣的Keras示例1。
参考示例中的分割是一个图像蒙版,其大小与相应的图像相似。我注意到作者在Keras模型中使用了批处理归一化层,并将图像(输入)和图像蒙版(目标)“包装”在keras.utils.Sequence
中。
以与牛津宠物示例相同的方式对地标(目标)进行矢量化是否有意义,还是我必须分别对地标坐标 1 进行归一化?