标签: opencl opencl-c
参考this问题,矢量化操作获得的性能增益是否可能被convert_T()的显式转换所抵消?请注意,变量的默认类型为unsigned char。我正在使用OpenCL 2.0。我的GPU是Intel HD Graphics 530(Gen9)。
unsigned char
它会在convert_int4()和convert_short4()之间产生影响吗?
convert_int4()
convert_short4()