使用pthread在C中生成随机数的最正确方法是什么

时间:2011-10-17 18:00:16

标签: c multithreading random pthreads srand

我有几个并发运行的线程,每个线程都必须生成随机数。我想了解是否存在要遵循的模式,以了解在主线程中使用srand初始化随机生成器是否正确,或者每个线程是否必须初始化其自己的随机生成器。似乎rand / srand没有被设计为与线程一起使用,我想知道如何处理线程和随机数。 感谢

编辑:我需要纯随机数,但我也有兴趣为测试目的生成确定性序列。我在linux上,但我更喜欢尽可能地编写代码。

6 个答案:

答案 0 :(得分:8)

在Linux上,您可以将rand_r()用于平庸的生成器或drand48_r()函数,以获得更好的效果。两者都是rand()drand48()的线程安全替换,通过采用由当前状态组成的单个参数,而不是使用全局状态。

关于初始化的问题,上面的两个生成器都允许你在你想要的任何点播种,所以在产生你的线程之前你不会被迫播种它们。

答案 1 :(得分:4)

当使用线程并进行例如模拟时,将随机生成器独立起来非常重要。首先,它们之间的依赖关系可能会对结果产生偏差,然后对随机生成器状态的访问控制机制很可能会降低执行速度。

在POSIX系统上(您似乎在那里)有*rand48个函数系列,其中erand48nrand48jrand48将随机生成器的状态视为输入值。因此,您可以在每个线程中轻松拥有独立的状态。那些你可以使用已知数字(例如你的线程数)进行初始化,并且你有一个可重复的随机数序列。或者您使用不可预测的内容(例如当前时间和时间)对其进行初始化。每个执行都有不同序列的数字。

答案 2 :(得分:1)

在Windows上,您可以使用线程安全的rand_s()函数。如果你已经在使用Boost,那么boost::random是有能力的(尽管我很欣赏它被标记为C,而不是C ++)。

答案 3 :(得分:1)

rand_r是线程安全的,但也是可重入的。

下面的代码使用xorshift算法生成uint128_t pseuso-random数字。

其他属性:

  • 共享重入
  • 无锁
  • 线程安全
  • 超快
  • 来自两个不同来源的enthropy

uintx_types.h:

#ifndef UINTX_TYPES_H_INCLUDED
#define UINTX_TYPES_H_INCLUDED

#include <inttypes.h>
#include <ctype.h>

typedef __uint128_t     uint128_t;
typedef __uint64_t      uint64_t;

#define UINT128_C(hi, lo)   (((uint128_t)(hi) << 64) | (uint128_t)(lo))
#define UINT128_MIN         UINT128_C( 0x0000000000000000, 0x0000000000000000 )
#define UINT128_0           UINT128_MIN
#define UINT128_MAX         (~(UINT128_0) - 1) 

#endif // UINTX_TYPES_H_INCLUDED

lf.h:

#ifndef LF_H_INCLUDED
#define LF_H_INCLUDED

#define AAF(ADDR, VAL)          __sync_add_and_fetch((ADDR), (VAL))

#endif // LF_H_INCLUDED

rand.h:

#ifndef RAND_H_INCLUDED
#define RAND_H_INCLUDED

#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>
#include <time.h>
#include <limits.h>
#include <fcntl.h>
#include <sys/types.h>
#include <unistd.h>

#include "lf.h"
#include "uintx_types.h"


#define URANDOM     "/dev/random"   

void        srand_init(void);
uint128_t   rand_range_128(uint128_t min, uint128_t max);

#endif // RAND_H_INCLUDED

rand.c:

#include "rand.h"

uint64_t    r[2];

uint64_t xorshift64star(int index) 
{   
    uint64_t    x;

    x = r[index];
    x ^= x >> 12; // a
    x ^= x << 25; // b
    x ^= x >> 27; // c
    x = x * UINT64_C(2685821657736338717);
    return AAF(&r[index], x);
}

void srand_init(void)
{
    struct timespec ts;
    size_t          nbytes;
    ssize_t         bytes_read;
    int             fd;

    clock_gettime(CLOCK_REALTIME, &ts);
    r[0] = (uint64_t)(ts.tv_sec * 1.0e9 + ts.tv_nsec);
    xorshift64star(0);

    if ((fd = open(URANDOM, O_RDONLY, S_IRUSR | S_IRGRP | S_IROTH)) == -1)
    {
        r[1] = r[0] + 1;
        xorshift64star(1);
    }
    else
    {
        nbytes = sizeof(r[1]);
        bytes_read = read(fd, &r[1], nbytes);
        if ((bytes_read == 0) || (r[1] == 0ull))
        {
            r[1] = r[0] + 1;
            xorshift64star(1);
        }
        close(fd);
    }
}

uint64_t rand_64(void)
{
    return xorshift64star(0);
}

uint128_t rand_128(void) 
{
    uint128_t       r;

    r = xorshift64star(0);
    r = (r << 64) | xorshift64star(1);
    return r;
}


uint128_t rand_range_128(uint128_t min, uint128_t max)
{
    return (rand_128() % (max+1-min))+min;
}

test.c的:

#define KEYS 1000

int main(int argc, char **argv)
{
    int             i;
    uint128_t       key;

    srand_init();

    for(i = 0; i <= KEYS; i++)
    {
        key = rand_range_128(UINT128_MIN, UINT128_MAX);
        printf("%016"PRIx64"%016"PRIx64"\n", (uint64_t)(key >> 64), (uint64_t)key);

    }
    return 0;
}

在Linux下编译gcc(4.9.2)。

答案 4 :(得分:0)

这个链接提供了一些从/ dev / random读取的代码 - 这应该是线程安全的 - 问题是一致的:

Is reading /dev/urandom thread-safe?

答案 5 :(得分:0)

在Linux系统上,您可以使用以下功能:

size_t random_between_range( size_t min, size_t max ){
    unsigned short state[3];
    unsigned int seed = time(NULL) + (unsigned int) pthread_self();
    memcpy(state, &seed, sizeof(seed));
    return min +  nrand48(state) % (max - min );
}

在这里我不得不说我真的不知道这个函数生成的数字是否适合正态分布,换句话说,如果这个函数是范围内的有效RNG(min,max),但至少对我有用写一个需要一些随机数的简单基准。

如您所见,该函数利用POSIX线程ID来重新排列随机种子。这样做,每个线程都有自己的随机种子,而不是使用全局状态,具体取决于time(NULL)