Question

代码如下：

#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <list>
#include <iterator>
#include <stdio.h>

template<class T> void InsertValueNode(std::list<T> &ValueList,T NewValue)
{
    std::list<T>::iterator itCurVal = ValueList.begin();
    while(itCurVal != ValueList.end())
    {
        if(NewValue < (*itCurVal))
            break;
        itCurVal++;
    }
    std::insert_iterator< std::list<T> > itNewNode(ValueList, itCurVal);
    *itNewNode = NewValue;
}

__global__ void addKernel(int *c, const int *a, const int *b)
{
    int i = threadIdx.x;
    c[i] = a[i] + b[i];
}

//to simplify the problem, just imply an empty main function
int main()
{
    return 0;
}

aboving代码位于visual studio 2010项目的.cu文件中。问题是编译时编译器无法识别STL迭代器定义：

error : identifier "itNumerical" is undefined
error : identifier "itCurVal" is undefined
error : expected a ";"

如果我将文件重命名为.cpp并重建，则可以编译代码，但会出现“错误LNK2001：未解析的外部符号threadIdx”的链接错误。那么如何构建代码？

Answer 1

这个可能是对标准库模板的CUDA C ++前端/解析器的限制。我可以用CUDA 8和gcc 4.8.5重现它。

作为一种解决方法，这似乎有效：

template<class T> void InsertValueNode(std::list<T> &ValueList,T NewValue)
{
    auto itCurVal = ValueList.begin();
    while(itCurVal != ValueList.end())
    {
        if(NewValue < (*itCurVal))
            break;
        itCurVal++;
    }
    std::insert_iterator< std::list<T> > itNewNode(ValueList, itCurVal);
    *itNewNode = NewValue;
}

使用nvcc控制编译时，只要使用-std=c++11选项即可。您可能想要考虑使用NVIDIA提交错误报告

如何构建包含cuda函数和c ++模板函数的代码

1 个答案: