如何使用正态分布生成最小值和最大值之间的整数?

时间:2019-05-14 13:54:41

标签: c++ c++11 random integer normal-distribution

我了解到我们使用

 unsigned seed = std::chrono::system_clock::now().time_since_epoch().count();
 std::default_random_engine generator (seed);
 std::normal_distribution<double> distribution (mean_value,variance_value);

生成实数。但是我不知道如何为这一代提供一个范围(最小和最大),以及在这种情况下如何仅生成整数。如果采用统一分配,则很简单。有人可以帮忙吗?谢谢!

1 个答案:

答案 0 :(得分:2)

好吧,您可以从给定点的正态分布计算概率,并将其用于离散采样。

沿线

#include <cmath>
#include <random>
#include <iostream>

constexpr double PI = 3.14159265359;

static inline double squared(const double x) {
    return x * x;
}

double GaussPDF(const double x,
                const double mu,
                const double sigma) {
    return exp(-0.5 * squared((x - mu) / sigma)) / (sqrt(2.0 * PI) * sigma);
}

int SampleTruncIntGauss(const int xmin, const int xmax, const double mu, const double sigma, std::mt19937_64& rng) {
    int n = xmax - xmin + 1;
    std::vector<double> p(n);
    for (int k = 0; k != n; ++k)
        p[k] = GaussPDF(static_cast<double>(xmin) + k, mu, sigma);

    std::discrete_distribution<int> igauss{ p.begin(), p.end() };

    return xmin + igauss(rng);
}

int main() {

    int xmin = -3;
    int xmax =  5;
    int n = xmax - xmin + 1;

    double mu = 1.2;
    double sigma = 2.3;

    std::mt19937_64 rng{ 98761728941ULL };

    std::vector<int> h(n, 0);

    for (int k = 0; k != 10000; ++k) {
        int v = SampleTruncIntGauss(xmin, xmax, mu, sigma, rng);
        h[v - xmin] += 1;
    }

    int i = xmin;
    for (auto k : h) {
        std::cout << i << "   " << k << '\n';
        ++i;
    }

    return 0;
}

您可以使代码更优化,每次采样时都会重新初始化概率数组,但这证明了这一思想的要旨。

更新

您还可以使用非点概率进行采样,基本上假设整数点x处的概率表示具有[x-0.5 ... x + 0.5]范围内的值的概率。这可以通过高斯CDF轻松表示。

constexpr double INV_SQRT2 = 0.70710678118;

double GaussCDF(const double x,
                const double mu,
                const double sigma) {
    double v = INV_SQRT2 * (x - mu) / sigma;
    return 0.5 * (1.0 + erf(v));
}

double ProbCDF(const int    x,
               const double mu,
               const double sigma) {
    return GaussCDF(static_cast<double>(x) + 0.5, mu, sigma) - GaussCDF(static_cast<double>(x) - 0.5, mu, sigma);
}

,概率代码为

for (int k = 0; k != n; ++k) {
    p[k] = ProbCDF(xmin + k, mu, sigma);

结果略有不同,但仍然类似于高斯