U-net与FCN背后的直觉用于语义分割

时间:2018-05-08 18:09:18

标签: neural-network artificial-intelligence image-segmentation convolutional-neural-network semantic-segmentation

我不太了解以下内容:

在提议的FCN for Semantic Segmentation by Shelhamer et al中,他们提出了像素到像素预测,以构建图像中对象的掩模/精确位置。

在用于生物医学图像分割的FCN的略微修改版本U-net中,主要区别似乎是“与合同路径中相应裁剪的特征图串联”。

现在,为什么这个功能特别适用于生物医学细分?我可以指出生物医学图像与其他数据集的主要区别在于,在生物医学图像中,没有像常见的每日对象那样定义对象的丰富功能集。此外,数据集的大小也是有限的。但这个额外的功能是受这两个事实还是其他原因的启发?

2 个答案:

答案 0 :(得分:6)

FCN vs U-Net:

FCN

  1. 只上传一次。即它在解码器中只有一层
  2. 原始实现github repo使用双线性插值来对卷积图像进行上采样。那就是这里没有可学习的过滤器
  3. FCN- [FCN 16s和FCN 8s]的变体添加来自较低层的跳过连接,以使输出对比例变化具有鲁棒性
  4. U形网络

    1. 多个上采样层
    2. 使用跳过连接和连接而不是添加
    3. 使用可学习的重量滤镜代替固定插值技术

答案 1 :(得分:1)

U-Net建立在J. Long的FCN论文之上。两个不同之处在于原始FCN论文使用​​解码器的一半来对分类进行上采样(即整个网络的后半部分是深度C - 类的数量)

U-Net认为下半部分处于特征空间,并在最后进行最终分类。

对生物医学IMO而言,没有什么特别之处