我正在使用FSharp.Collections.ParallelSeq
和retry computation编写一个刮刀。我想从多个页面并行检索HTML,我想在失败时重试请求。
例如:
open System
open FSharp.Collections.ParallelSeq
type RetryBuilder(max) =
member x.Return(a) = a // Enable 'return'
member x.Delay(f) = f // Gets wrapped body and returns it (as it is)
// so that the body is passed to 'Run'
member x.Zero() = failwith "Zero" // Support if .. then
member x.Run(f) = // Gets function created by 'Delay'
let rec loop(n) =
if n = 0 then failwith "Failed" // Number of retries exceeded
else try f() with _ -> loop(n-1)
loop max
let retry = RetryBuilder(4)
let getHtml (url : string) = retry {
Console.WriteLine("Get Url")
return 0;
}
//A property/field?
let GetHtmlForAllPages =
let pages = {1 .. 10}
let allHtml = pages |> PSeq.map(fun x -> getHtml("http://somesite.com/" + x.ToString())) |> Seq.toArray
allHtml
[<EntryPoint>]
let main argv =
let htmlForAllPages = GetHtmlForAllPages
0 // return an integer exit code
当我尝试与GetHtmlForAllPages
main
进行互动时,代码似乎挂了。单步执行代码会显示PSeq.map
开始处理pages
的前四个值。
导致retry
计算表达式永远不会启动/完成的原因是什么? PSeq
和retry
之间是否存在一些奇怪的相互作用?
如果我将GetHtmlForAllPages
作为一个函数并调用它,代码将按预期工作。我很好奇当GetHtmlForAllPages
是一个字段时会发生什么?
答案 0 :(得分:5)
看起来你在静态构造函数中死锁了。该方案描述为here:
CLR使用内部锁来确保静态构造函数:
- 仅被调用一次
- 在创建任何实例之前执行 在访问任何静态成员之前或之前。
有了这种行为 CLR,如果我们执行任何操作,就有可能出现僵局 静态构造函数中的异步阻塞操作。 (...)
主线程将等待辅助线程在其中完成 静态构造函数。由于辅助线程正在访问实例 方法,它将首先尝试获取内部锁。作为内部 锁是已经被主线程获得的,我们最终会在一个 死锁情况。
在静态构造函数中使用并行LINQ(或任何其他类似的库,如FSharp.Collections.ParallelSeq)会让你遇到这个问题。
不幸的是,编译器生成的类的静态构造函数是您获得GetHtmlForAllPages
值的。来自ILSpy(使用C#格式化):
namespace <StartupCode$ConsoleApplication1>
{
internal static class $Program
{
[DebuggerBrowsable(DebuggerBrowsableState.Never)]
internal static readonly Program.RetryBuilder retry@17;
[DebuggerBrowsable(DebuggerBrowsableState.Never)]
internal static readonly int[] GetHtmlForAllPages@24;
[DebuggerBrowsable(DebuggerBrowsableState.Never), DebuggerNonUserCode, CompilerGenerated]
internal static int init@;
static $Program()
{
$Program.retry@17 = new Program.RetryBuilder(4);
IEnumerable<int> pages = Operators.OperatorIntrinsics.RangeInt32(1, 1, 10);
ParallelQuery<int> parallelQuery = PSeqModule.map<int, int>(new Program.allHtml@26(), pages);
ParallelQuery<int> parallelQuery2 = parallelQuery;
int[] allHtml = SeqModule.ToArray<int>((IEnumerable<int>)parallelQuery2);
$Program.GetHtmlForAllPages@24 = allHtml;
}
}
}
以及您实际的Program
课程:
[CompilationMapping(SourceConstructFlags.Value)]
public static int[] GetHtmlForAllPages
{
get
{
return $Program.GetHtmlForAllPages@24;
}
}
死锁的来源。
只要将GetHtmlForAllPages
更改为函数(通过添加()
),它就不再是静态构造函数的一部分,这使得程序按预期工作。