我使用以下简单代码获取段错误:
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include <iostream>
#include <thread>
#include <unistd.h>
void run() {
sleep(1); // see below
cv::Mat source(10, 10, CV_32FC1, -1);
cv::Mat result(10, 10, CV_32FC1);
cv::Mat trX(result.rows, result.cols, CV_32FC1, 5);
cv::Mat trY(result.rows, result.cols, CV_32FC1, 5);
cv::remap(source, result, trX, trY, cv::INTER_LINEAR, cv::BORDER_TRANSPARENT);
std::cout << "done" << std::endl;
}
int main(int argc, char* argv[]) {
std::thread t1(run);
t1.join();
std::thread t2(run);
t2.join();
return 0;
}
如果我直接从run()
拨打main()
两次,而根本不使用线程,则效果很好。如果我交换t1.join();
和std::thread t2(run);
(也就是说,在第一个完成之前启动第二个线程;这是sleep
变得重要的地方),它也运行良好。
此外,如果我将main
更改为
int main(int argc, char* argv[]) {
std::thread t1(run);
std::thread t2(run);
t1.join();
t2.join();
std::thread t3(run);
t3.join();
return 0;
}
它在第三个线程中的段错误,但(奇怪的是)并不总是:大约一次成功通过2-3次传递。但是,我无法通过上面的两个线程成功运行该程序。
source
,trX
和trY
中的特定值似乎并不重要。
我正在制作的大型程序在12月正常运行,之后我没有时间处理它,但已多次更新系统。现在大程序失败了完全相同的段错误,所以我认为它应该是更新版本的opencv和/或g ++和/或libstdc ++。
我的系统或代码有问题吗?还是一些已知的问题?或者我应该在哪里报告?
我正在运行最新的Ubuntu 16.10,使用g ++ 6.2.0(我也尝试了4.9,结果相同)。可能感兴趣的软件包的特定版本是:
$ dpkg-query -W -f='${binary:Package}\t${Version}\n' | grep -E '(g\+\+|c\+\+|opencv)'
g++ 4:6.1.1-1ubuntu2
g++-4.9 4.9.4-2ubuntu1
g++-5 5.4.1-2ubuntu2
g++-6 6.2.0-5ubuntu12
lib32stdc++6 6.2.0-5ubuntu12
libflac++6v5:amd64 1.3.1-4
libopencv-calib3d2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-contrib2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-core-dev:amd64 2.4.9.1+dfsg-2.1
libopencv-core2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-features2d2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-flann2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-highgui-dev:amd64 2.4.9.1+dfsg-2.1
libopencv-highgui2.4-deb0:amd64 2.4.9.1+dfsg-2.1
libopencv-imgproc-dev:amd64 2.4.9.1+dfsg-2.1
libopencv-imgproc2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-legacy2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-ml2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-objdetect2.4v5:amd64 2.4.9.1+dfsg-2.1
libopencv-video2.4v5:amd64 2.4.9.1+dfsg-2.1
libsigc++-2.0-0v5:amd64 2.8.0-2
libstdc++-4.9-dev:amd64 4.9.4-2ubuntu1
libstdc++-5-dev:amd64 5.4.1-2ubuntu2
libstdc++-6-dev:amd64 6.2.0-5ubuntu12
libstdc++6:amd64 6.2.0-5ubuntu12
libstdc++6:i386 6.2.0-5ubuntu12
我使用以下命令构建代码:
g++ --std=c++14 test.cpp -lpthread -lopencv_highgui -lopencv_core -lopencv_imgproc -o test
Valgrind输出:
==18499== Thread 2:
==18499== Invalid read of size 8
==18499== at 0x690F0BA: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x690F18A: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x6910CE7: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x690F691: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x690A01F: ??? (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x6908164: tbb::internal::allocate_root_with_context_proxy::allocate(unsigned long) const (in /usr/lib/x86_64-linux-gnu/libtbb.so.2)
==18499== by 0x51D9E21: cv::parallel_for_(cv::Range const&, cv::ParallelLoopBody const&, double) (in /usr/lib/x86_64-linux-gnu/libopencv_core.so.2.4.9)
==18499== by 0x55AE8A1: cv::remap(cv::_InputArray const&, cv::_OutputArray const&, cv::_InputArray const&, cv::_InputArray const&, int, int, cv::Scalar_<double> const&) (in /usr/lib/x86_64-linux-gnu/libopencv_imgproc.so.2.4.9)
==18499== by 0x1094AC: run() (in /home/petr/osm/draw/test/test)
==18499== by 0x10A360: void std::_Bind_simple<void (*())()>::_M_invoke<>(std::_Index_tuple<>) (in /home/petr/osm/draw/test/test)
==18499== by 0x10A2ED: std::_Bind_simple<void (*())()>::operator()() (in /home/petr/osm/draw/test/test)
==18499== by 0x10A2BD: std::thread::_State_impl<std::_Bind_simple<void (*())()> >::_M_run() (in /home/petr/osm/draw/test/test)
==18499== Address 0xfffffffffffffff7 is not stack'd, malloc'd or (recently) free'd
答案 0 :(得分:2)
OpenCV提供parallel_for_
函数,允许使用计算机上提供的并行框架(Intel TBB,Pthreads等)轻松并行部分代码。
在您的情况下,您的OpenCV版本似乎是2.4.9
,TBB用作默认的parallel_for_
后端。
Here TBB的另一个问题是从多个线程调用的。 解决方案可能是在从源代码构建OpenCV时禁用TBB并使用Pthreads(禁用TBB并在CMake中启用Pthread)。
你的解决方案也应该没问题。对于setNumThreads(0)
,文档说:
如果threads == 0,OpenCV将禁用线程优化并运行 所有它的功能都是顺序的。
我想setNumThreads(1)
也应该没问题?
不幸的是,我无法准确确定问题的根源:
cv::remap
一般不是线程安全的,还是只有TBB?我做了两次测试:
OpenCV 3.2
,Pthread用作parallel_for_
后端OpenCV 3.2
并使用TBB代替在这两种情况下,我都没有遇到任何问题。所以我希望它已经在较新的OpenCV版本或者更新的TBB版本中得到解决。
注意:您可以使用
std::cout << "getBuildInformation:\n" << cv::getBuildInformation() << std::endl;
打印OpenCV信息。在我的第二次测试中,我得到:
Parallel framework: TBB (ver 4.4 interface 9003)