单声道下的堆栈大小

时间:2013-11-06 16:45:23

标签: .net recursion f# mono

我编写了一个很小的递归F#代码,看看在.NET / Mono下我可以在堆栈上放入多少级别的递归。它只是在精确的2次幂时打印递归深度,所以我发现最大深度在2的范围内。

我使用System.Threading.Thread (ThreadStart, int)在具有定义堆栈空间量的线程中启动代码。在.Net下,每个递归级别似乎需要大约100个字节,而我可以在2G堆栈上获得大约1600万个级别。 Mono下的内存使用情况大致相似,但是我只能获得大约3万个级别。通过大约Thread增加传递给600000的堆栈大小值不会增加递归深度。

ulimit报告堆栈大小限制为1G。

一个明显的解释是,如果它太大,Mono将不会服从Thread的第二个参数。有没有人知道如何说服Mono分配一个大堆栈?

代码很简单,但是以下是有人关心的:

let rec f i =
    if popcount i = 1 then // population count is one on exact powers of 2
        printf "Got up to %d\n" i
        stdout.Flush ()
    if i = 1000000000 then 0 else 1 + f (i+1)

4 个答案:

答案 0 :(得分:8)

选项1:更改单声道堆栈大小

  

一个明显的解释是,如果它太大,Mono将不会服从Thread的第二个参数。有没有人知道如何说服Mono分配一个大堆栈?

你是正确的,Mono将限制堆栈大小,即使你传入一个大的值。例如,在我的Cent OS 64位测试机器上,Mono将分配的最大堆栈大小为2兆字节。 Mono C# source file Thread.cs向我们展示了创建 Mono 线程时会发生什么:

public Thread (ThreadStart start, int maxStackSize)
{
    if (start == null)
        throw new ArgumentNullException ("start");

    threadstart = start;
    Internal.stack_size = CheckStackSize (maxStackSize);
}

static int CheckStackSize (int maxStackSize)
{
    if (maxStackSize < 0)
        throw new ArgumentOutOfRangeException ("less than zero", "maxStackSize");

    if (maxStackSize < 131072) // make sure stack is at least 128k big
        return 131072;

    int page_size = Environment.GetPageSize ();

    if ((maxStackSize % page_size) != 0) // round up to a divisible of page size
        maxStackSize = (maxStackSize / (page_size - 1)) * page_size;

    int default_stack_size = (IntPtr.Size / 4) * 1024 * 1024; // from wthreads.c
    if (maxStackSize > default_stack_size)
        return default_stack_size;

    return maxStackSize; 
}

上面的代码对堆栈大小设置了硬性限制。

理论上,您可以更改上述一个或两个函数(粗线)中的代码,以便分配更大的堆栈大小。完成此操作后,您必须构建Mono运行时,然后运行您的函数以查看更改是否有所作为。

我应该强调的是,我对Mono的了解不足以了解分配更大的堆栈是否有助于您的具体情况。我只会做这个作为最后的手段(如果我的其他答案都不起作用)。

答案 1 :(得分:4)

选项2:F#尾调用

一种选择是重写方法,以便使用递归tail calls。从之前的(维基百科)链接:

  

尾递归函数是递归的一种特殊情况,其中在该方法中执行的最后一条指令是递归调用。 F#和许多其他函数语言可以优化尾递归函数;因为在递归调用之后不执行额外的工作,所以函数不需要记住它来自哪里,因此没有理由在堆栈上分配额外的内存。

     

F#通过告诉CLR在执行目标函数之前删除当前堆栈帧来优化尾递归函数。因此,尾递归函数可以无限递归,而不会占用堆栈空间。

有一点需要注意 - Mono并不完全支持尾递归调用 - 您应该首先在.Net运行时进行测试,然后查看代码是否在Mono中运行。 / p>

这是使用尾递归调用重写的示例函数 - 它在.NET(使用Visual Studio 2010)和Mono(Mono版本3.2.0,F#3.0)中都有效:

let f i =
    let rec loop acc counter =
        // display progress every 10k iterations
        let j = counter % 10000
        if j = 0 then
            printf "Got up to %d\n" counter
            stdout.Flush ()

        if counter < 1000000000 then
            // tail recursive
            loop (acc + 1) (counter + 1)
        else
            acc

    loop 0 i

输入值1:

let result = f 1
printf "result %d\n" result

输出:

Got up to 10000
Got up to 20000
Got up to 30000
...
Got up to 999980000
Got up to 999990000
Got up to 1000000000
result 999999999

输入值999,999,998:

let result = f 999999998
printf "result %d\n" result

输出:

Got up to 1000000000
result 2

上面的代码使用两个变量来跟踪进度:

acc - 累加器,用于存储计算结果

counter - 只是递归调用的次数

为什么您的示例代码不是尾递归的?

解释维基百科文章的How To Write Tail-Recursive Functions部分,我们可以重写代码的这一行

if i = 1000000000 then 0 else 1 + f (i+1)

作为

if i = 1000000000 then 0
else
    let intermediate = f (i+1) // recursion
    let result = 1 + intermediate // additional operations
    result

尾递归的定义表示在递归调用之后不能有其他操作。正如我们在代码的重写版本中所看到的,生成结果需要额外的操作。

<强>资源

答案 2 :(得分:2)

选项3:使其迭代

一个选项是重写您的方法,使其不是递归的,而是迭代的。也就是说,您更改方法以使其成为计算结果的循环:

let f i =
    let mutable acc = 0
    for counter in i .. 1000000000 do
        // display progress every 10k iterations
        let j = counter % 10000
        if j = 0 then
            printf "Got up to %d\n" counter
            stdout.Flush ()

        if counter < 1000000000 then
            acc <- acc + 1
    acc

输入值1:

let result = f 1
printf "result %d\n" result

输出:

Got up to 10000
Got up to 20000
Got up to 30000
...
Got up to 999980000
Got up to 999990000
Got up to 1000000000
result 999999999

输入值999,999,998:

let result = f 999999998
printf "result %d\n" result

输出:

Got up to 1000000000
result 2

上面的代码使用两个变量来跟踪进度:

acc - 累积器,存储计算结果

counter - 只是迭代调用的次数(循环次数)

由于我们使用循环来计算结果,因此没有分配任何额外的堆栈。

答案 3 :(得分:0)

此代码符合单声道限制。它对竞争性编程中的dfs很有用。

        public static void IncreaseStack(ThreadStart action, int stackSize = 16000000)
        {
            var thread = new Thread(action, stackSize);
#if __MonoCS__
        const BindingFlags bf = BindingFlags.NonPublic | BindingFlags.Instance;
        var it = typeof(Thread).GetField("internal_thread", bf).GetValue(thread);
        it.GetType().GetField("stack_size", bf).SetValue(it, stackSize);
#endif
            thread.Start();
            thread.Join();
        }