RNGCryptoServiceProvider对大型随机数进行卡方检验失败

时间:2014-01-02 08:29:29

标签: c# algorithm random

当试图获得超过300,000,000的数字时,是否有人知道为什么RNGCryptoServiceProvider无法进行卡方检验。

我试图获得0-1,000,000,000范围内的随机数,结果我收到了卡方检验失败,0-300,000,000范围内的数字显得比其他数字更多。

最终我将大数字形式与较小数字(0-99 * 100M + 0-99,999,999)和卡方测试合格相结合。

任何人都可以大量解释这种异常现象吗?

我使用以下代码来获取数字

    [Timeout(TestTimeout.Infinite), TestMethod]
    public void TestMethodStatistic()
    {
        Dictionary<long, long> appearances = new Dictionary<long, long>();
        UInt64 tenBillion = 10000000000;

        for (UInt64 i = 0; i < 10000000; i++)
        {
            UInt64 random = GetSIngleRandomNumberInternal() % tenBillion;
            UInt64 bucket = random /10000000;

            if (!appearances.ContainsKey(Convert.ToInt64(bucket)))
            {
                appearances.Add(Convert.ToInt64(bucket), 0);
            }
            appearances[Convert.ToInt64(bucket)]++;
        }
        string results = "\nBucket Id\tcount\n";
        foreach (var appearance in appearances)
        {
            results += appearance.Key+"\t"+ appearance.Value +"\n";
        }
        File.AppendAllText(@"C:\Result.txt",results);
    }

    private RNGCryptoServiceProvider rngCsp = new RNGCryptoServiceProvider();

    private UInt64 GetSIngleRandomNumberInternal()
    {
        byte[] randomNumBytes = new byte[sizeof(UInt64)];
        rngCsp.GetBytes(randomNumBytes);


        return BitConverter.ToUInt64(randomNumBytes, 0);
    }

获取Result.txt文件并将内容复制到excel。 使它成为一个表并添加2列1是预期结果,值为100000,第二个是卡方检验值为“= CHISQ.TEST([count],[[expected]])”

当卡方检验的值小于0.1时,我们遇到了问题。

1 个答案:

答案 0 :(得分:6)

最有可能的问题是,当您使用余数技术时,您会引入偏差。有关说明,请参阅How much bias is introduced by the remainder technique?