我有一小部分航空图像,其中图像中可见的不同地形已被人类专家标记。例如,图像可以包含植被,河流,落基山脉,农田等。每个图像可以具有一个或多个这些标记区域。使用这个小的标记数据集,我想为每种已知的地形类型拟合高斯混合模型。完成此操作后,对于图像中可能遇到的每N种类型的地形,我将拥有N个GMM。
现在,给定一张新图像,我想通过将像素分配给最可能的GMM来确定每个像素所属的地形。 这是正确的思路吗?如果可以,我该如何使用GMM对图像进行聚类
答案 0 :(得分:-1)
直觉上,您的思考过程是正确的。如果您已经有了标签,可以使此操作变得简单得多。
例如,让我们选择一个众所周知的非参数算法,例如“已知最近邻居” https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
在这种算法中,您将采用新的“像素”,然后将找到最接近的k像素,例如您当前正在评估的k像素;最接近的位置由某个距离函数(通常是欧几里得)确定。然后,您可以从那里将这个新像素分配给最常出现的分类标签。
我不确定您是否在寻找特定的算法建议,但是KNN将是开始测试此类练习的很好算法。我看到您标记了sklearn
,scikit learning有一个very good KNN implementation,建议您继续阅读。
答案 1 :(得分:-1)
如果使用带标签的训练数据,它不会聚类!
但是,您可以轻松使用GMM群集的标签功能。
为此,计算先验概率,均值和协方差矩阵,并将其求逆。然后使用来自训练数据的多元高斯方法,按照最大概率密度(按先验概率加权)对新图像的每个像素进行分类。