C中的非递归因子

时间:2013-11-21 01:03:59

标签: c parallel-processing factorial loop-unrolling

我有一个简单的问题要问你。我做了这个代码来计算一个没有递归的数字的阶乘。

int fact2(int n){
    int aux=1, total = 1;
    int i;
    int limit = n - 1;
    for (i=1; i<=limit; i+=2){
        aux = i*(i+1);
        total = total*aux;
    }
    for (;i<=n;i++){
        total = total*i;
    }
return total;

}

如您所见,我的代码使用循环展开来优化执行中的时钟周期。现在我被要求为同一个代码添加双向并行性,任何想法如何?

1 个答案:

答案 0 :(得分:2)

您可以使用ptherads库创建两个单独的线程。每个线程应该进行一半的乘法运算。我可以将以下解决方案放在一起。

#include <pthread.h>

typedef struct {
    int id;
    int num;
    int *result;
} thread_arg_t;

void* thread_func(void *arg) {
    int i;
    thread_arg_t *th_arg = (thread_arg_t *)arg;
    int start, end;
    if(th_arg->id == 0) {
        start = 1;
        end = th_arg->num/2;
    } else if (th_arg->id == 1) {
        start = th_arg->num / 2;
        end = th_arg->num + 1;
    } else {
        return NULL;
    }
    for(i=start; i < end; i++) {
            th_arg->result[th_arg->id] *= i;
    }
    return NULL;
}

int factorial2(int n) {
    pthread_t threads[2];
    int rc;
    int result[2];
    thread_arg_t th_arg[2];
    for(i=0; i<2; i++) {
        th_arg[i].id = i;
        th_arg[i].num = n;
        th_arg[i].result = result;
        rc = pthread_create(&threads[i], NULL, thread_func, (void *)&th_arg[i]);
        if (rc){
         printf("pthread_create() failed, rc = %d\n", rc);
         exit(1);
      }
    }

    /* wait for threads to finish */
    for(i=0; i<2; i++) {
      pthread_join(thread[i], NULL);

    /* compute final one multiplication */
    return (result[0] * result[1]);
}

pthread库实现应该为您并行处理两个线程的工作。此外,此示例可以针对N个线程进行一般性修改。