标签: c++ opencv simd convolution
与this问题相关,我想将filter2D函数的性能与SIMDized 2D卷积的多线程版本进行比较。对于我的实现,AVX2,我在for循环之前使用#omp parallel for但是filter2D在这个实现中就像一个黑盒子。一个未经测试的解决方案可能是使用pthreads库在Mat的不同部分执行多个filter2D。但是,这个解决方案并不温和。我应该怎么做才能在filter2D函数中使用线程,并将其与多线程SIMD实现进行比较,合理呢?
#omp parallel for
pthreads
Mat