我试图了解YOLO的工作原理以及它如何检测图像中的物体。我的问题是,k均值聚类在检测对象周围的边界框时起什么作用?谢谢。
答案 0 :(得分:2)
通常,对象的边界框由以下形式的元组给出 (x0,y0,x1,y1),其中x0,y0是左下角的坐标,x1,y1是右上角的坐标。
需要从这些坐标中提取宽度和高度,并针对图像的宽度和高度标准化数据。
K均值指标
IoU比以前更好
Jaccard索引=(选定框与簇头框之间的交集)/(选定框与簇头框之间的联合)
在初始化时,我们可以选择k个随机框作为簇头。根据IoU值>阈值将锚定框分配给各个群集,并计算群集的平均IoU。
可以重复此过程,直到收敛为止。
答案 1 :(得分:1)
K均值聚类算法是数据科学中非常著名的算法。该算法旨在将n
个观测划分为k
个簇。主要包括:
K
表示(即质心)是随机生成的。分配:通过将每个观察值与最近的质心相关联来形成聚类。
更新聚类:新创建的聚类的质心变为均值。
分配和更新将反复进行,直到收敛为止。 最终结果是最小化了点及其质心之间的平方误差总和。
编辑:
为什么用K表示
确定锚框的真正作用
谢谢!