我试图为加密安全随机数编写Haskell库。代码如下:
module URandom (URandom, initialize) where
import qualified Data.ByteString.Lazy as B
import System.Random
import Data.Word
newtype URandom = URandom [Word8]
instance RandomGen URandom where
next (URandom (x : xs)) = (fromIntegral x, URandom xs)
split (URandom l) = (URandom (evens l), URandom (odds l))
where evens (x : _ : xs) = x : evens xs
odds (_ : x : xs) = x : odds xs
genRange _ = (fromIntegral (minBound :: Word8), fromIntegral (maxBound :: Word8))
initialize :: IO URandom
initialize = URandom . B.unpack <$> B.readFile "/dev/urandom"
不幸的是,它的行为并不像我想要的那样。特别是,表演
take 10 . randoms <$> initialize
收益率(类似于)
[-4611651379516519433,-4611644973572935887,-31514321567846,9223361179177989878,-4611732094835278236,9223327886739677537,4611709625714976418,37194416358963,4611669560113361421,-4611645373004878170,-9223329383535098640,4611675323959360258,-27021785867556,9223330964083681227,4611705212636167666]
对我来说,未经训练的白眼,眼睛,看起来不是很随意。很多46 ......和92 ......在那里。
可能出现什么问题?为什么这不会产生分布均匀的数字?值得注意的是,即使我将Word8
连接在一起形成Int
s,分布也没有改善,我也不认为在这里包含该代码是值得的。
编辑:这里有一些未正确分发的证据。我写了一个名为histogram的函数:
histogram :: ∀ t . (Integral t, Bounded t)
=> [t] -> Int -> S.Seq Int
histogram [] buckets = S.replicate buckets 0
histogram (x : xs) buckets = S.adjust (+ 1) (whichBucket x) (histogram xs buckets)
where whichBucket x = fromIntegral $ ((fromIntegral x * fromIntegral buckets) :: Integer) `div` fromIntegral (maxBound :: t)
当我跑
时g <- initialize
histogram (take 1000000 $ randoms g :: [Word64]) 16
我回来了
fromList [128510,0,0,121294,129020,0,0,122090,127873,0,0,120919,128637,0,0,121657]
有些水桶是空的!
答案 0 :(得分:8)
问题是random-1.1
中修复了random-1.1
中的错误。 The changelog指向this ticket。特别是,参考旧版本:
它还假设所有RandomGen实现都产生与StdGen相同的随机值范围。
这里,一次产生8位随机性,这导致观察到的行为。
globals()
解决了这个问题:
此实现也适用于任何RandomGen,即使每次调用只产生一位熵或具有非零的最小边界的随机数。