Matterport Mask R-CNN-大图像的不可预测的损耗值和奇怪的检测结果

时间:2018-10-13 02:07:37

标签: tensorflow image-processing machine-learning keras conv-neural-network

使用Mask R-CNN无法获得可行的结果,我似乎无法查明原因。我使用的是大型灰度图像(2560 x 2160)的相当有限的数据集(13个图像),其中检测目标非常小(平均面积为26像素)。我已经对我的数据运行了inspect_nucleus_data.ipynb,并验证了掩膜和图像是否正确解释。我还遵循了Wiki指南(https://github.com/matterport/Mask_RCNN/wiki),将我的图像作为灰度图像进行读取和处理,而不仅仅是将其转换为RGB。这是标记有检测目标的图像之一。

annotated image

在训练过程中,损失值几乎是不可预测的,在1到2之间反弹,却从未达到似乎一直在收敛的稳定下降。我现在正在使用这些配置值。它们是我在解决OOM错误时能想到的最好的方法:

Configurations:
BACKBONE                       resnet101
BACKBONE_STRIDES               [4, 8, 16, 32, 64]
BATCH_SIZE                     1
BBOX_STD_DEV                   [0.1 0.1 0.2 0.2]
COMPUTE_BACKBONE_SHAPE         None
DETECTION_MAX_INSTANCES        450
DETECTION_MIN_CONFIDENCE       0
DETECTION_NMS_THRESHOLD        0.3
FPN_CLASSIF_FC_LAYERS_SIZE     1024
GPU_COUNT                      1
GRADIENT_CLIP_NORM             5.0
IMAGES_PER_GPU                 1
IMAGE_CHANNEL_COUNT            1
IMAGE_MAX_DIM                  1024
IMAGE_META_SIZE                14
IMAGE_MIN_DIM                  1024
IMAGE_MIN_SCALE                0
IMAGE_RESIZE_MODE              square
IMAGE_SHAPE                    [1024 1024    1]
LEARNING_MOMENTUM              0.9
LEARNING_RATE                  0.001
LOSS_WEIGHTS                   {'mrcnn_class_loss': 1.0, 'mrcnn_bbox_loss': 1.0,     'rpn_bbox_loss': 1.0, 'mrcnn_mask_loss': 1.0, 'rpn_class_loss': 1.0}
MASK_POOL_SIZE                 14
MASK_SHAPE                     [28, 28]
MAX_GT_INSTANCES               450
MEAN_PIXEL                     [16.49]
MINI_MASK_SHAPE                (56, 56)
NAME                           nucleus
NUM_CLASSES                    2
POOL_SIZE                      7
POST_NMS_ROIS_INFERENCE        1000
POST_NMS_ROIS_TRAINING         2000
PRE_NMS_LIMIT                  6000
ROI_POSITIVE_RATIO             0.33
RPN_ANCHOR_RATIOS              [0.5, 1, 2]
RPN_ANCHOR_SCALES              (2, 4, 8, 16, 32)
RPN_ANCHOR_STRIDE              1
RPN_BBOX_STD_DEV               [0.1 0.1 0.2 0.2]
RPN_NMS_THRESHOLD              0.9
RPN_TRAIN_ANCHORS_PER_IMAGE    512
STEPS_PER_EPOCH                11
TOP_DOWN_PYRAMID_SIZE          256
TRAIN_BN                       False
TRAIN_ROIS_PER_IMAGE           256
USE_MINI_MASK                  True
USE_RPN_ROIS                   True
VALIDATION_STEPS               1
WEIGHT_DECAY                   0.0001

我正在所有层面上进行训练。我得到的输出通常看起来像这样,在怪异的点上发现了类似网格的检测结果,但却似乎无法准确地识别出一个核。我添加了红色方块,以突出显示一个非常明显的原子团簇,而该团簇已被忽略:

output image

以下是这些检测结果的二进制掩码,因此您可以看到它们的形状: output mask

有人可以阐明这里可能出什么问题吗?

1 个答案:

答案 0 :(得分:1)

将训练图像尺寸调整一半时,某些信息会丢失。 Square也占用大量内存。因此,您可能要使用作物。而不是正方形模式下的1024 * 1024,而是512 * 512。由于边界框超出范围,您可能会遇到NAN,在这种情况下,您需要对数据Feed进行一些调整。

您想关闭迷你面罩,因为这会影响您的准确性。使用裁切模式应该可以帮助您节省大量内存。所以你不用担心。