应用错误收集

我认为Cilk的模型是嵌套的任务并行性（可以用来实现）数据并行）。这很可爱，但是......

Cilk不支持SIMD数据并行或流并行。

Cilk似乎没有很好地处理部分订单，因为它只提供嵌套并行性。尝试编写以下一组并行任务：A，B，C，D，排序约束A在B之前，A在D之前，C在D之前。（这是嵌套任务并行性不能的最小部分任务顺序的规范示例直接编码）。你失去了一些用嵌套并行性实现这一点的并行性。并行是宝贵的，你不想浪费机会并行。

它不处理跨线程边界的（AFAIK）异常处理。如果您想构建一个非常大的，复杂的符号应用程序，则需要这样做。如果你想以推测方式计算它也很有用。

我也不认为Cilk可以处理计算粒之间的大量交互（等待同步事件），因为Cilk程序中的AFAIK只能拥有与OS提供的线程一样多的实时并行计算。这是因为Cilk实现选择生活在标准C / C ++编译器及其堆栈模型之上，在大多数工作站中使用每个线程的一个大堆栈模型。你可能达到10或100，但不是10,000;这在处理非常大的图时很重要。 [我不知道Cilk甚至允许计算粒子同步的事实，但我没有看到任何技术上的原因，如果它放弃了大堆栈模型它就不能。]

第二个含义是Cilk应用程序无法在大型数据结构上进行递归，因为您选择的任何大小的堆栈都是有界的，并且有一些示例可能会耗尽堆栈。（这不是Cilk的设计缺陷，只是它的实现）。这太糟糕了，因为巨大的东西是你想要并行的地方之一。

有关替代方案，请参阅提供的PARLANSE 任意大量的计算颗粒，具有工作窃取，但具有堆分配的颗粒和激活记录。每个粒子都有自己的上下文（因此可以实现大量相互作用的粒子集，因为当需要等待事件时，可以直接保存粒子状态.PARLANSE同步原语包括期货，信号量和关键函数结果（见下文））

PARLANSE提供明确的“团队”（计算粒子集）作为抽象，将异常传播出计算粒度的顶部（Java将其定义为“未定义”，这是愚蠢的），给团队父母，作为异步中止异常（在try子句中捕获）返回所有其他团队子级，允许其他子级清理。

由于某些操作（例如，异步中止 - 异常）可以在任意时间发生，因此PARLANSE提供关键函数的概念，其结果保证以原子方式返回给调用者，因此函数要么肯定地返回结果，要么不能，并且该函数可以在异步中止处理程序中安全地清理资源。

特殊的“偏序”团队允许人们编码已知部分顺序的计算;我认为如果你有大量的这样的话，这比Cilk的嵌套并行性更有效。

（我们使用PARLANSE来实现large-scale program analysis/transformation tools.。PARLANSE是为了支持这一点而发明的;我们想要并行性，因为我们处理的工件很大，很好，树和图形代表了数百万行代码。

（PARLANSE也不做流或SIMD，但它们不在语言范围之外。可以说可以将流和SIMD添加到C和C ++中，但可能很难）。

Cilk的共享内存并行编程的方法是灵丹妙药吗？

1 个答案: