代码如下:
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <list>
#include <iterator>
#include <stdio.h>
template<class T> void InsertValueNode(std::list<T> &ValueList,T NewValue)
{
std::list<T>::iterator itCurVal = ValueList.begin();
while(itCurVal != ValueList.end())
{
if(NewValue < (*itCurVal))
break;
itCurVal++;
}
std::insert_iterator< std::list<T> > itNewNode(ValueList, itCurVal);
*itNewNode = NewValue;
}
__global__ void addKernel(int *c, const int *a, const int *b)
{
int i = threadIdx.x;
c[i] = a[i] + b[i];
}
//to simplify the problem, just imply an empty main function
int main()
{
return 0;
}
aboving代码位于visual studio 2010项目的.cu文件中。问题是编译时编译器无法识别STL迭代器定义:
error : identifier "itNumerical" is undefined
error : identifier "itCurVal" is undefined
error : expected a ";"
如果我将文件重命名为.cpp并重建,则可以编译代码,但会出现“错误LNK2001:未解析的外部符号threadIdx”的链接错误。 那么如何构建代码?
答案 0 :(得分:0)
这个可能是对标准库模板的CUDA C ++前端/解析器的限制。我可以用CUDA 8和gcc 4.8.5重现它。
作为一种解决方法,这似乎有效:
template<class T> void InsertValueNode(std::list<T> &ValueList,T NewValue)
{
auto itCurVal = ValueList.begin();
while(itCurVal != ValueList.end())
{
if(NewValue < (*itCurVal))
break;
itCurVal++;
}
std::insert_iterator< std::list<T> > itNewNode(ValueList, itCurVal);
*itNewNode = NewValue;
}
使用nvcc控制编译时,只要使用-std=c++11
选项即可。您可能想要考虑使用NVIDIA提交错误报告