如何通过移植FPGA算法估算GPU FLOP?

时间:2014-05-29 02:19:35

标签: algorithm parallel-processing gpu fpga

我有一系列目前在FPGA架构中实现的信号处理算法。我想将此处理转移到基于GPU的服务器,但我需要估计需要多少GPU。这项任务的最佳方法是什么?我是否应该尝试将每个数学运算分解为FLOP计数然后将其全部添加并希望我远程进入球场?

1 个答案:

答案 0 :(得分:0)

如果将FLOP计数所需的操作除以GPU性能,即使在最佳情况下,您也会获得所需时间的下限,但无法保证GPU实际上能够保持所需的性能。这个,或者你将能够在任何合理的时间内编写所需的程序。我还会看看您选择的GPU可以使用哪些信号处理库,看看它们中是否提供了接近您需要的东西。如果您可以通过库调用和一些基于cpu的粘合代码来解决所需问题,那么您可以在没有GPU的情况下为胶水代码计时,然后查看库规格以确定它们需要多长时间才会出现并出现有时间估计你可以希望在没有太多乐观的情况下实现。