深度学习架构可用于不同大小的输入和输出吗?

时间:2018-10-24 11:03:33

标签: tensorflow keras deep-learning artificial-intelligence

我对深度学习还很陌生,我正在尝试与Tensorflow和Keras一起玩。我已经完成了一些教程的工作,这些教程解释了如何在标签数据上使用CNN。

现在我想尝试一些不同的东西。我有大小(m,n,o)的输入数据和大小(m,n,p)的输出数据。因此,输入和输出数据具有相同数量的像素(m,n),但具有不同数量的通道。使用每个像素的o参数,应生成具有p通道的输出像素。

我该如何实现? CNN是合适的体系结构还是我应该使用其他体系结构?您知道有关此问题的任何教程或流行语吗?

2 个答案:

答案 0 :(得分:1)

您可以查看Semantic Segmentation。听起来很相似。通常,输入具有3个通道(RGB),输出通道的数量等于要检测的类的数量。

用于此任务的基于CNN的体系结构相当多,上面的链接中描述了其中的一些体系结构,可将其用于您的任务。

答案 1 :(得分:0)

在我的思维空间中,适用的短语是“ image-2-image”。是否要使用CNN很大程度上取决于您的翻译内容。如果从o频道到p频道的转换与上下文无关,那么CNN就是巨大过度杀伤力。

例如,如果您试图将显示磷光体(RGB)转换为打印机的分离度(CYMK),则只需在每个像素上进行简单的矩阵乘法即可。

相反,如果您要涉及空间邻​​近性和区域特征以进行转换-使用附近的像素识别形状,然后从这些区域形状生成输出图像-那么就需要使用CNN。