通过深度学习(最好是Keras)识别场景的方法是什么。 有许多示例显示了如何对有限大小的图像进行分类,例如狗/猫手写字母等。还有一些示例,用于检测大图像中的搜索对象。
但是,识别例如是教室,卧室还是餐厅?使用该图像创建数据集?我想不是。我认为应该训练一个模型,其中包含可能会出现在场景中的许多事物,在分析的图像中创建找到的事物的向量,并使用第二个分类器(SVM或简单NN)对场景进行分类。这是正确的方法吗?
P.S .:实际上,我面临另一个问题,即IHMO相同。我的“场景”是显微镜图像。图像包含不同组的单元格和伪像。医生根据诊断结果进行诊断。因此,我的目标是训练带有伪像的CNN,并使用简单的morphologicyl方法提取这些伪像。这些文物(例如生物细胞)将是我的特色。因此,识别的第一级-特征提取是由CNN完成的,随后的分类是由SVM完成的。只是想确定一下,我没有重新发明轮子。
答案 0 :(得分:0)
我认为您的房间场景和生物场景之间的比较有所不同。特别是因为您的场景是显微镜图像(可能是有限的预定义域)。
在这种情况下,纯分类应该起作用(不查看数据)。换句话说,神经网络应该能够弄清楚所看到的内容,而无需您手工制作功能(以防万一,这是一个全新的讨论)。
在此paper中,还有很多用于场景理解的方法。