Tensorflow - 基于多个图像作为输入进行分类,而不是一个

时间:2018-02-17 10:49:59

标签: python tensorflow deep-learning conv-neural-network

我正在建立CNN,告诉我一个人是否有脑损伤。我打算使用tf inception v3模型和build_image_data.py脚本来构建 TFRecord

数据集由脑部扫描组成。每次扫描都有大约100张图像(不同的头部姿势,角度)。在某些图像上,可见损坏,但有些则不然。我无法将扫描中的所有图像标记为损坏正面(或负面),因为其中一些图像会被标记为错误(如果扫描在损坏时为正,但在特定图像上不可见)。

有没有办法将整个扫描标记为正/负,并以此方式训练网络? 训练完成后,将扫描作为输入传递给网络(不是单个图像)并对其进行分类。

1 个答案:

答案 0 :(得分:2)

看起来多实例学习可能是您的方法。看看这两篇论文:

Multiple Instance Learning Convolutional Neural Networks for Object Recognition

Classifying and segmenting microscopy images with deep multiple instance learning

最后一个是由@dancsalo实现的(不确定他是否有堆栈溢出帐户)here

我看起来像第二篇论文处理非常大的图像并将它们分成子图像,但标记整个图像。因此,它就像用标签标记一袋图像,而不必为每个子图像制作标签。在您的情况下,您可以构建一个图像矩阵,即每个扫描的10个图像x 10图像主图像......

如果您这样做以及它是否适用于您的数据集,请告诉我们!