F#NativePtr.stackalloc意外的堆栈溢出

时间:2016-02-18 02:36:22

标签: f# stack unmanaged-memory

仍在进行我的F#性能测试并尝试使基于堆栈的阵列正常工作。有关更多背景信息,请参阅此处:f# NativePtr.stackalloc in Struct Constructor

据我了解,每个函数调用都应该在堆栈中获得自己的帧。然后通过移回堆栈指针返回时释放该存储器。但是,下面会导致堆栈溢出错误 - 不确定为什么stackalloc在函数内部执行。

有趣的是,这只发生在发布模式,而不是调试模式。

我相信dotnet的标准堆栈大小是1MB,我没有调整我的。我希望分配8192整数(32768字节)不会炸掉堆栈。

#nowarn "9"

module File1 =

    open Microsoft.FSharp.NativeInterop
    open System
    open System.Diagnostics    

    let test () =
        let stackAlloc x =
            let mutable ints:nativeptr<int> = NativePtr.stackalloc x
            ()

        let size = 8192            
        let reps = 10000
        let clock = Stopwatch()
        clock.Start()
        for i = 1 to reps do            
            stackAlloc size
        let elapsed = clock.Elapsed.TotalMilliseconds
        let description = "NativePtr.stackalloc"
        Console.WriteLine("{0} ({1} ints, {2} reps): {3:#,##0.####}ms", description, size, reps, elapsed)

    [<EntryPoint>]
    let main argv = 
        printfn "%A" argv
        test ()
        Console.ReadKey() |> ignore
        0

更新 按照Fyodor Soikin的建议用ILSpy反编译后,我们可以看到在优化过程中发生了内联。有点酷,有点可怕!

using Microsoft.FSharp.Core;
using System;
using System.Diagnostics;
using System.IO;

[CompilationMapping(SourceConstructFlags.Module)]
public static class File1
{
    public unsafe static void test()
    {
        Stopwatch clock = new Stopwatch();
        clock.Start();
        for (int i = 1; i < 10001; i++)
        {
            IntPtr intPtr = stackalloc byte[8192 * sizeof(int)];
        }
        double elapsed = clock.Elapsed.TotalMilliseconds;
        Console.WriteLine("{0} ({1} ints, {2} reps): {3:#,##0.####}ms", "NativePtr.stackalloc", 8192, 10000, elapsed);
    }

    [EntryPoint]
    public static int main(string[] argv)
    {
        PrintfFormat<FSharpFunc<string[], Unit>, TextWriter, Unit, Unit> format = new PrintfFormat<FSharpFunc<string[], Unit>, TextWriter, Unit, Unit, string[]>("%A");
        PrintfModule.PrintFormatLineToTextWriter<FSharpFunc<string[], Unit>>(Console.Out, format).Invoke(argv);
        File1.File1.test();
        ConsoleKeyInfo consoleKeyInfo = Console.ReadKey();
        return 0;
    }
}

此外,以下内容可能会引起关注:

http://www.hanselman.com/blog/ReleaseISNOTDebug64bitOptimizationsAndCMethodInliningInReleaseBuildCallStacks.aspx

还可以使用属性调整优化:

https://msdn.microsoft.com/en-us/library/system.runtime.compilerservices.methodimploptions(v=vs.110).aspx?cs-save-lang=1&cs-lang=fsharp#code-snippet-1

1 个答案:

答案 0 :(得分:4)

如果您的stackAlloc函数被内联,则会发生这种情况,从而导致stackalloc在test的框架内发生。这也解释了为什么它只会发布在Release中:inlining是一种优化,它在Debug中的执行速度远远低于Release。

为了确认这一点,我会尝试使用ILSpy查看生成的代码。

为什么首先需要使用堆栈分配的数组?这看起来就像唐纳德克努特警告我们的那种事情。 : - )