越来越多的线程会增加循环执行的时间而不是减少它。
#include <time.h>
#include <stdio.h>
#include <stdlib.h>
#include <omp.h>
#include <limits.h>
#define n 4
int main(int argc, char **argv)
{
FILE * file1 = fopen("output.txt", "w");
if (file1 == NULL){
exit(EXIT_FAILURE);
}
srand(time(NULL));
int matrix[n][n];
int i, j;
for(i = 0; i < n; i++){
for (j = 0; j < n; j++){
matrix[i][j] = rand() % 100 + 1;
fprintf(file1, "%d ", matrix[i][j]);
}
fprintf(file1, "\n");
}
int sum = 0;
int min;
double start;
double end;
启动cout循环时间
start = omp_get_wtime();
// in num_threads I've changed the number of threads
// and investigate a problem of increasing the time
#pragma omp parallel for private (i, j, min) reduction(+:sum) num_threads(4)
for(i = 0; i < n; i++){
min = INT_MAX;
for (j = 0; j < n; j++){
if(matrix[j][i] < min){
min = matrix[j][i];
}
}
sum += min; // sum of min numbers of each column
}
end = omp_get_wtime();
printf("Time: %lf\n", end - start);
printf("Min sum of matrix = %d", sum);
fclose(file1);
return 0;
}
4个线程
时间:0.000930
3个螺纹
时间:0.000356
2个螺纹
时间:0.000533
1个线程
时间:0.000008
我的CPU有4个线程。
答案 0 :(得分:1)
你有一个非常小的问题(4x4),你正在计划线程创建。我不认为并行性在这种规模上有多大帮助(因为只是唤醒线程然后在并行结束时再次同步它们的成本将远大于你想要做的工作),但是你可以通过添加
来消除从测量中创建线程池的成本 #pragma omp parallel
;
在定时区域之前。
而且,请,请,请不要强制线程数。使用OMP_NUM_THREADS
令人满意的。