标签: machine-learning computer-vision object-detection
我正在努力了解对象检测中的锚框定义。
假设锚框的尺寸为w和h,比例为s,纵横比为w/h。基础框的尺寸为w_0和h_0。
w
h
s
w/h
w_0
h_0
然后为什么是w = s * w_0 * sqrt(r)和h = s * h_0 / sqrt(r)?
w = s * w_0 * sqrt(r)
h = s * h_0 / sqrt(r)
规模的定义是什么?是w * h / ( w_0 * h_0 )吗?
w * h / ( w_0 * h_0 )
谢谢!