仍在进行我的F#性能测试并尝试使基于堆栈的阵列正常工作。有关更多背景信息,请参阅此处:f# NativePtr.stackalloc in Struct Constructor。
据我了解,每个函数调用都应该在堆栈中获得自己的帧。然后通过移回堆栈指针返回时释放该存储器。但是,下面会导致堆栈溢出错误 - 不确定为什么stackalloc在函数内部执行。
有趣的是,这只发生在发布模式,而不是调试模式。
我相信dotnet的标准堆栈大小是1MB,我没有调整我的。我希望分配8192整数(32768字节)不会炸掉堆栈。
#nowarn "9"
module File1 =
open Microsoft.FSharp.NativeInterop
open System
open System.Diagnostics
let test () =
let stackAlloc x =
let mutable ints:nativeptr<int> = NativePtr.stackalloc x
()
let size = 8192
let reps = 10000
let clock = Stopwatch()
clock.Start()
for i = 1 to reps do
stackAlloc size
let elapsed = clock.Elapsed.TotalMilliseconds
let description = "NativePtr.stackalloc"
Console.WriteLine("{0} ({1} ints, {2} reps): {3:#,##0.####}ms", description, size, reps, elapsed)
[<EntryPoint>]
let main argv =
printfn "%A" argv
test ()
Console.ReadKey() |> ignore
0
更新 按照Fyodor Soikin的建议用ILSpy反编译后,我们可以看到在优化过程中发生了内联。有点酷,有点可怕!
using Microsoft.FSharp.Core;
using System;
using System.Diagnostics;
using System.IO;
[CompilationMapping(SourceConstructFlags.Module)]
public static class File1
{
public unsafe static void test()
{
Stopwatch clock = new Stopwatch();
clock.Start();
for (int i = 1; i < 10001; i++)
{
IntPtr intPtr = stackalloc byte[8192 * sizeof(int)];
}
double elapsed = clock.Elapsed.TotalMilliseconds;
Console.WriteLine("{0} ({1} ints, {2} reps): {3:#,##0.####}ms", "NativePtr.stackalloc", 8192, 10000, elapsed);
}
[EntryPoint]
public static int main(string[] argv)
{
PrintfFormat<FSharpFunc<string[], Unit>, TextWriter, Unit, Unit> format = new PrintfFormat<FSharpFunc<string[], Unit>, TextWriter, Unit, Unit, string[]>("%A");
PrintfModule.PrintFormatLineToTextWriter<FSharpFunc<string[], Unit>>(Console.Out, format).Invoke(argv);
File1.File1.test();
ConsoleKeyInfo consoleKeyInfo = Console.ReadKey();
return 0;
}
}
此外,以下内容可能会引起关注:
还可以使用属性调整优化:
答案 0 :(得分:4)
如果您的stackAlloc
函数被内联,则会发生这种情况,从而导致stackalloc在test
的框架内发生。这也解释了为什么它只会发布在Release中:inlining是一种优化,它在Debug中的执行速度远远低于Release。
为了确认这一点,我会尝试使用ILSpy查看生成的代码。
为什么首先需要使用堆栈分配的数组?这看起来就像唐纳德克努特警告我们的那种事情。 : - )