应用错误收集

包含多个OpenCL内核的程序与具有一个内核的程序的优点相比？

时间：2013-11-20 19:50:23

标签： c++ c opencl

这个问题源于我希望在运行时从各种内核构建一个OpenCL程序。所以，想象一下，我想在给定的上下文中使用相同的内存对象集执行各种内核。

如果我提前知道我想要组合成一个程序的所有内核，我就没有问题 - 只需创建一个包含所有内核源代码或二进制文件的程序。

但是，鉴于我没有提前知道我想要合并的内核，我正在考虑为每个内核源创建一个程序。这是否等同于原始情况（假设编译时选项都相同）？调用驻留在不同程序中的内核会有性能损失吗？

问题可能是我不理解“程序”的抽象。它是什么？它不仅仅是一个内核集合和一些编译时选项吗？

1 个答案:

答案 0 :(得分：3)

将OpenCL内核分组到一个程序中有以下几个好处：

通过多次clBuildProgram()调用多次调用编译器的（轻微）开销。通过将单个源字符串编译为单个程序，然后从中创建多个内核，可以避免这种情况。但是，在获得内核对象后，基于它来自的程序，性能应该没有差别。

更显着的好处：在程序中将内核组合在一起允许它们引用和使用彼此和/或其他相关的帮助程序函数。

示例：程序可能会定义一个在球形和笛卡尔坐标之间进行转换的函数，然后可以由多个内核使用，而不需要复制它。

相关问题

如何为具有不同工作项的两个不同内核定义两次globalsize？

内核具有相同名称的多个程序

包含多个OpenCL内核的程序与具有一个内核的程序的优点相比？

从一个程序运行多个程序

对于OpenCL中的不同内核/程序，缓冲区的设备地址是否相同

如何用内核编译opencl项目

单个程序中的多个内核与每个程序的一个内核

跨工作组读取的迭代内核有什么好的策略？

在OpenCL中分发内核

OpenCL：来自不同程序的内核并行执行

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？