cv :: remap与std :: thread的段错误

时间:2017-03-16 18:57:58

标签: c++ multithreading opencv segmentation-fault

我使用以下简单代码获取段错误:

#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"

#include <iostream>
#include <thread>
#include <unistd.h>

void run() {
    sleep(1);  // see below
    cv::Mat source(10, 10, CV_32FC1, -1);

    cv::Mat result(10, 10, CV_32FC1);
    cv::Mat trX(result.rows, result.cols, CV_32FC1, 5);
    cv::Mat trY(result.rows, result.cols, CV_32FC1, 5);

    cv::remap(source, result, trX, trY, cv::INTER_LINEAR, cv::BORDER_TRANSPARENT);
    std::cout << "done" << std::endl;
}

int main(int argc, char* argv[]) {
    std::thread t1(run);
    t1.join();
    std::thread t2(run);
    t2.join();
    return 0;
}

如果我直接从run()拨打main()两次,而根本不使用线程,则效果很好。如果我交换t1.join();std::thread t2(run);(也就是说,在第一个完成之前启动第二个线程;这是sleep变得重要的地方),它也运行良好。

此外,如果我将main更改为

int main(int argc, char* argv[]) {
    std::thread t1(run);
    std::thread t2(run);
    t1.join();
    t2.join();
    std::thread t3(run);
    t3.join();
    return 0;
}

它在第三个线程中的段错误,但(奇怪的是)并不总是:大约一次成功通过2-3次传递。但是,我无法通过上面的两个线程成功运行该程序。

sourcetrXtrY中的特定值似乎并不重要。

我正在制作的大型程序在12月正常运行,之后我没有时间处理它,但已多次更新系统。现在大程序失败了完全相同的段错误,所以我认为它应该是更新版本的opencv和/或g ++和/或libstdc ++。

我的系统或代码有问题吗?还是一些已知的问题?或者我应该在哪里报告?

我正在运行最新的Ubuntu 16.10,使用g ++ 6.2.0(我也尝试了4.9,结果相同)。可能感兴趣的软件包的特定版本是:

$ dpkg-query -W -f='${binary:Package}\t${Version}\n' | grep -E '(g\+\+|c\+\+|opencv)'
g++     4:6.1.1-1ubuntu2
g++-4.9 4.9.4-2ubuntu1
g++-5   5.4.1-2ubuntu2
g++-6   6.2.0-5ubuntu12
lib32stdc++6    6.2.0-5ubuntu12
libflac++6v5:amd64      1.3.1-4
libopencv-calib3d2.4v5:amd64    2.4.9.1+dfsg-2.1
libopencv-contrib2.4v5:amd64    2.4.9.1+dfsg-2.1
libopencv-core-dev:amd64        2.4.9.1+dfsg-2.1
libopencv-core2.4v5:amd64       2.4.9.1+dfsg-2.1
libopencv-features2d2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-flann2.4v5:amd64      2.4.9.1+dfsg-2.1
libopencv-highgui-dev:amd64     2.4.9.1+dfsg-2.1
libopencv-highgui2.4-deb0:amd64 2.4.9.1+dfsg-2.1
libopencv-imgproc-dev:amd64     2.4.9.1+dfsg-2.1
libopencv-imgproc2.4v5:amd64    2.4.9.1+dfsg-2.1
libopencv-legacy2.4v5:amd64     2.4.9.1+dfsg-2.1
libopencv-ml2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-objdetect2.4v5:amd64  2.4.9.1+dfsg-2.1
libopencv-video2.4v5:amd64      2.4.9.1+dfsg-2.1
libsigc++-2.0-0v5:amd64 2.8.0-2
libstdc++-4.9-dev:amd64 4.9.4-2ubuntu1
libstdc++-5-dev:amd64   5.4.1-2ubuntu2
libstdc++-6-dev:amd64   6.2.0-5ubuntu12
libstdc++6:amd64        6.2.0-5ubuntu12
libstdc++6:i386 6.2.0-5ubuntu12

我使用以下命令构建代码:

g++ --std=c++14 test.cpp -lpthread -lopencv_highgui -lopencv_core -lopencv_imgproc -o test

Valgrind输出:

==18499== Thread 2:
==18499== Invalid read of size 8
==18499==    at 0x690F0BA: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499==    by 0x690F18A: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499==    by 0x6910CE7: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499==    by 0x690F691: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499==    by 0x690A01F: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499==    by 0x6908164: tbb::internal::allocate_root_with_context_proxy::allocate(unsigned long) const (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499==    by 0x51D9E21: cv::parallel_for_(cv::Range const&, cv::ParallelLoopBody const&, double) (in /usr/lib/x86_64-linux-gnu/libopencv_core.so.2.4.9)
==18499==    by 0x55AE8A1: cv::remap(cv::_InputArray const&, cv::_OutputArray const&, cv::_InputArray const&, cv::_InputArray const&, int, int, cv::Scalar_<double> const&) (in /usr/lib/x86_64-linux-gnu/libopencv_imgproc.so.2.4.9)
==18499==    by 0x1094AC: run() (in /home/petr/osm/draw/test/test)
==18499==    by 0x10A360: void std::_Bind_simple<void (*())()>::_M_invoke<>(std::_Index_tuple<>) (in /home/petr/osm/draw/test/test)
==18499==    by 0x10A2ED: std::_Bind_simple<void (*())()>::operator()() (in /home/petr/osm/draw/test/test)
==18499==    by 0x10A2BD: std::thread::_State_impl<std::_Bind_simple<void (*())()> >::_M_run() (in /home/petr/osm/draw/test/test)
==18499==  Address 0xfffffffffffffff7 is not stack'd, malloc'd or (recently) free'd

1 个答案:

答案 0 :(得分:2)

OpenCV提供parallel_for_函数,允许使用计算机上提供的并行框架(Intel TBBPthreads等)轻松并行部分代码。

在您的情况下,您的OpenCV版本似乎是2.4.9,TBB用作默认的parallel_for_后端。

Here TBB的另一个问题是从多个线程调用的。 解决方案可能是在从源代码构建OpenCV时禁用TBB并使用Pthreads(禁用TBB并在CMake中启用Pthread)。

你的解决方案也应该没问题。对于setNumThreads(0),文档说:

  

如果threads == 0,OpenCV将禁用线程优化并运行   所有它的功能都是顺序的。

我想setNumThreads(1)也应该没问题?

不幸的是,我无法准确确定问题的根源:

  • cv::remap一般不是线程安全的,还是只有TBB?
  • TBB版本的问题? (不确定this是否相关)
  • 使用OpenCV版本的问题?

我做了两次测试:

  • 在Ubuntu 16.04上从源代码构建OpenCV 3.2,Pthread用作parallel_for_后端
  • 在Ubuntu 16.04上从源代码构建OpenCV 3.2并使用TBB代替

在这两种情况下,我都没有遇到任何问题。所以我希望它已经在较新的OpenCV版本或者更新的TBB版本中得到解决。

注意:您可以使用

std::cout << "getBuildInformation:\n" << cv::getBuildInformation() << std::endl;

打印OpenCV信息。在我的第二次测试中,我得到:

Parallel framework: TBB (ver 4.4 interface 9003)