程序执行优化

时间:2014-02-04 05:12:19

标签: optimization driver gpgpu execution-time algorithmic-trading

我正在根据J.Welles Wilder Jr.撰写的书编写抛物线时间价格系统程序。 我已经通过该程序,运行时的执行时间为122微秒。这远高于基准限制。如果我

,我正在寻找的是一些观点和提示
  1. 编写一个内核空间程序来实现同样的目的。通过驱动程序实现它
  2. [真的热衷于这个方法]是否可能,如果是,那么我应该如何以及在哪里开始寻找,将指令传递给图形驱动程序以执行步骤和计算(在某处的博客中阅读)。
  3. 先谢谢。

    --->编程c

1 个答案:

答案 0 :(得分:2)

GPU的速度非常快,它可以异步运行大约2000~(取决于卡)线程。 如果您的代码可以划分为线程,那么它可能会提高您的性能以在gpgpu上进行计算,因为平均CPU速度为50-100 GFlops,并且正确使用时平均GPU速度为1500。 您也可以考虑维护gpgpu代码的困难。我建议你,如果你有一个NVidia GPU,你应该看看'Managed CUDA',因为它包含一个调试器和一个GPU分析器,可以使用它。

TL; DR:仅将gpgpu用于异步代码,如果可能,最好使用“托管CUDA”