Question

Folowing代码段来自 OpenCV find_obj.cpp，这是使用 SURF 的演示，


double
compareSURFDescriptors( const float* d1, const float* d2, double best, int length )
{
    double total_cost = 0;
    assert( length % 4 == 0 );
    int i;
    for( i = 0; i  best )
            break;
    }
    return total_cost;
}

据我所知，检查欧几里德距离，我不明白为什么它以4个为一组进行？为什么不一次计算整件事？

Answer 1

通常这样做是为了使SSE优化成为可能。 SSE寄存器长度为128位，可以包含4个浮点数，因此您可以并行使用一条指令进行4次减法。

另一个好处：你必须在每四个差异之后检查循环计数器。即使编译器没有使用机会生成SSE代码，这也会使代码更快。例如，VS2008没有，甚至没有-O2：

    
      double t0 = d1[i] - d2[i];
00D91666  fld         dword ptr [edx-0Ch] 
00D91669  fsub        dword ptr [ecx-4] 
        double t1 = d1[i+1] - d2[i+1];
00D9166C  fld         dword ptr [ebx+ecx] 
00D9166F  fsub        dword ptr [ecx] 
        double t2 = d1[i+2] - d2[i+2];
00D91671  fld         dword ptr [edx-4] 
00D91674  fsub        dword ptr [ecx+4] 
        double t3 = d1[i+3] - d2[i+3];
00D91677  fld         dword ptr [edx] 
00D91679  fsub        dword ptr [ecx+8] 
        total_cost += t0*t0 + t1*t1 + t2*t2 + t3*t3;
00D9167C  fld         st(2) 
00D9167E  fmulp       st(3),st 
00D91680  fld         st(3) 
00D91682  fmulp       st(4),st 
00D91684  fxch        st(2) 
00D91686  faddp       st(3),st 
00D91688  fmul        st(0),st 
00D9168A  faddp       st(2),st 
00D9168C  fmul        st(0),st 
00D9168E  faddp       st(1),st 
00D91690  faddp       st(2),st

Answer 2

我认为这是因为每个分区我们得到4个数字。完全4x4x4子区域制作64长度矢量。所以它基本上得到了2个子区域之间的差异。

OpenCV SURF比较描述符

2 个答案: