我最近需要加速C ++中的卷积运算,我想知道是否有可能在不使用OpenGL或OpenCL的情况下使用Intel HD Graphics 4000的某些功能来加速某些操作,例如卷积或矩阵乘法。
答案 0 :(得分:3)
简答:据我所知,此处没有非hacky ,有文档记录,独立于编译器的标准C ++方式。
英特尔提供了一个使用英特尔编译器特定扩展的卷积示例:
https://software.intel.com/en-us/node/610441
然而, Cilk Plus的东西在18.0编译器中被弃用。
在
Release Notes
状态卸载支持英特尔®图形技术。
所需的命令行标志为-qopenmp-offload=gfx
。
因此,最便携的非OpenCL方式将使用OpenMP Offload指令。他们可能在某些时候也被其他编译器用于英特尔图形架构。此外,代码仍然是可移植的,默认为自动卸载所使用的编译器不支持的体系结构。