用于并行计算的CPU卡?

时间:2009-04-25 01:33:05

标签: process parallel-processing cpu

我记得前段时间读过有系统的cpu卡可以增加额外的处理能力来进行大规模并行化。任何人都有这方面的经验和任何资源来研究项目的硬件和软件方面?这项技术是否不如传统集群?它是否更具能量意识?

5 个答案:

答案 0 :(得分:4)

有两个很酷的选择。一个是使用GPU作为米奇提到的。另一种是获得PS / 3,它有一个多核Cell处理器。

您还可以设置多个便宜的主板PC并运行Linux和Beowulf。

答案 1 :(得分:2)

您是否查看了各种GPU Computing选项。 Nvidia(可能还有其他人)正在提供基于利用显卡功能的个人超级计算机。

答案 2 :(得分:2)

GPGPU可能是发烧友最实用的选择。然而,DSP是另一种选择,例如由德州仪器,飞思卡尔,ADI公司和恩智浦半导体制造的那些。当然,其中大多数可能更多地针对工业用户,但你可能会研究Storm-1系列的DSP,其中一些应该低至每片60美元。

数据并行的另一个选择是物理处理单元,如Nvidia(以前的Ageia)PhysX。这些协处理器最明显的用途是用于游戏,但它们也用于科学建模,加密和其他矢量处理应用程序。

ClearSpeed Attached Processors是另一种可能性。这些基本上是专为HPC应用程序设计的SIMD协处理器,因此它们可能超出了您的价格范围,但我只是在这里猜测。

所有这些建议都是基于数据并行性,因为我认为这是最具潜力的领域。通过简单地利用矢量处理和更专业的SIMD指令集,可以以更低的时钟速率(并且使用更少的功率)更快地执行当前CPU密集型应用程序。

实际上,大多数计算机用户不需要比英特尔凌动处理器更多的休闲计算需求:电子邮件,浏览网页和播放音乐/视频。对于实际上需要大量处理能力的其他10%的计算任务,通用的标量处理器通常不是最适合工作的工具。

即使大多数拥有严格处理需求的人也只需要它来进行狭窄的应用;物理学家不需要能够播放最新FPS的PC;音响工程师不需要进行科学建模或进行统计分析;并且图形设计师不需要进行数字信号处理。具有高度专业化指令集的域特定矢量处理器(如用于游戏的现代GPU)将能够比高功率通用CPU更有效地处理这些任务。

集群计算无疑对核研究等许多高端工业应用非常有用,但我认为矢量处理对普通人来说有更多实际用途。

答案 3 :(得分:1)

OpenCL - 是跨不同供应商和处理器类型,单核,多核,图形卡,单元等进行HPC计算的行业标准...请参阅http://en.wikipedia.org/wiki/OpenCL

我们的想法是,无论处理器类型如何,使用简单的代码库都可以使用机器上的所有备用处理能力。

Apple已在其下一版Mac OS X中实施此标准。还将提供nVIDIA,ATI,Intel等产品。

答案 4 :(得分:0)

Mercury Computing提供Cell Accelerator Board,它是一个PCIe卡,有一个Cell处理器,运行Yellow Dog Linux,或Mercury的YDL风格。 Fixstars提供了更强大的Cell PCIe板,称为GigaAccel。我打电话给Mercury,他们说他们的电路板大约5000美元,没有软件。我猜GigaAccel的价格高达两倍。

我找到了一块使用过的水银板,但它没有配备电源线,所以我还没能用它,不幸的是。