F#中的生命游戏与加速器

时间:2010-03-22 09:03:58

标签: f# gpu accelerator conways-game-of-life

我正在尝试使用加速器v2在F#中写下生命,但由于一些奇怪的原因,尽管我的所有数组都是正方形,但我的输出不是正方形 - 看起来除了矩阵左上角的矩形区域之外的所有内容都是设置为false。我不知道这是怎么发生的,因为我的所有操作都应该平等对待整个阵列。有什么想法吗?

open Microsoft.ParallelArrays
open System.Windows.Forms
open System.Drawing
type IPA = IntParallelArray
type BPA = BoolParallelArray
type PAops = ParallelArrays
let RNG = new System.Random()
let size = 1024
let arrinit i = Array2D.init size size (fun x y -> i)
let target = new DX9Target()
let threearr = new IPA(arrinit 3)
let twoarr =   new IPA(arrinit 2)
let onearr =   new IPA(arrinit 1)
let zeroarr =  new IPA(arrinit 0)
let shifts = [|-1;-1|]::[|-1;0|]::[|-1;1|]::[|0;-1|]::[|0;1|]::[|1;-1|]::[|1;0|]::[|1;1|]::[]
let progress (arr:BPA) = let sums = shifts //adds up whether a neighbor is on or not
                                    |> List.fold (fun (state:IPA) t ->PAops.Add(PAops.Cond(PAops.Rotate(arr,t),onearr,zeroarr),state)) zeroarr
                         PAops.Or(PAops.CompareEqual(sums,threearr),PAops.And(PAops.CompareEqual(sums,twoarr),arr)) //rule for life
let initrandom () = Array2D.init size size (fun x y -> if RNG.NextDouble() > 0.5 then true else false)

type meform () as self= 
    inherit Form()
    let mutable array = new BoolParallelArray(initrandom())
    let timer = new System.Timers.Timer(1.0) //redrawing timer
    do base.DoubleBuffered <- true
    do base.Size <- Size(size,size)
    do timer.Elapsed.Add(fun _ -> self.Invalidate())
    do timer.Start()
    let draw (t:Graphics) = 
        array <- array |> progress
        let bmap = new System.Drawing.Bitmap(size,size)
        target.ToArray2D array
        |> Array2D.iteri (fun x y t ->
                 if not t then bmap.SetPixel(x,y,Color.Black))
        t.DrawImageUnscaled(bmap,0,0)

    do self.Paint.Add(fun t -> draw t.Graphics)

do Application.Run(new meform())

2 个答案:

答案 0 :(得分:6)

正如Robert所说,我写了一篇文章,展示了如何使用Accelerator v2实现Game of Life in F#,因此您可以查看工作版本。我记得有类似的问题,但我不确切知道在什么情况下。

无论如何,如果你正在使用DX9Target,那么问题可能是这个目标不应该支持整数运算(因为使用DX9精确地模拟GPU上的整数算术)。我相信这也是我在我的实现中最终使用FloatParallelArray的原因。你有没有机会尝试X64MulticoreTarget看看它是否有效?

编辑:我做了一些进一步的调查(除非我遗漏了一些重要的事情),这似乎是CompareEqual方法的错误。这是一个更简单的例子,显示了这个问题:

open Microsoft.ParallelArrays 

let target = new DX9Target() 
let zeros = new IntParallelArray(Array2D.create 4 4 0) 
let trues = target.ToArray2D(ParallelArrays.CompareEqual(zeros, zeros))

trues |> Array2D.iter (printfn "%A")

预期结果为true(几次),但如果你运行它,它只打印true 4次,然后打印12次false。我会问加速器团队的人并在这里发布答案。与此同时,您可以像我在示例中那样做 - 也就是说,使用FPA模拟布尔操作,并避免使用BPACompareEqual

编辑2 :以下是加速器小组成员的回复:

  

这与DX9 GPU上缺乏精确的整数计算有关。由于数值抖动,整数与其自身的布尔比较并不总是计算为完全相等。 (...)

因此,总而言之,您不能真正依赖BPA。唯一的选择是按照我的建议 - 使用FPA模拟布尔值(并且可能将数字与一些小的delta邻域进行比较以避免GPU引起的抖动)。然而,这个shoudl可以与X86MulticoreTarget一起使用 - 如果你能找到一些最小的repro来显示库崩溃的情况,那将非常有用!

答案 1 :(得分:2)

关于精度问题:DX9级GPU没有专用的整数硬件,因此整数流被解释为浮点流(缺乏精度)。

DX10级GPU现在支持精确的32位整数和所有C位按位运算。但这并不意味着它们具有真正的32位整数ALU。例如,在当前的DX10 NVIDIA gen整数数学中,使用24位整数单元,因此模拟了32位整数运算。下一代DX11 NVIDIA将带来真正的32位整数单位。