我写的是;
#include <thrust/system_error.h>
#include <thrust/host_vector.h>
#include <thrust/device_vector.h>
#include <thrust/sequence.h>
#include <thrust/transform.h>
#include <thrust/replace.h>
#include <thrust/copy.h>
#include <thrust/functional.h>
#include <iostream>
#include <cmath> //std:sqr
using namespace thrust;
// Kernel Code
template <class K>
struct sum_square_functor{
__host__ __device__ K operator()(const K& x, const K& y)const{
return pow(x-y,2);
}
};
//Test code on CPU
//void perform_euclidean(){
//
//}
int main(){
device_vector<float> p_vec(1 << 20);
device_vector<float> q_vec(1 << 20);
device_vector<float> r_vec(1 << 20);
generate(p_vec.begin(), p_vec.end(), rand);
generate(q_vec.begin(), q_vec.end(), rand);
// Current Thrust's transformations supports 2 input vectors, so we use it
transform(p_vec.begin(), p_vec.end(), q_vec.begin(), r_vec.begin(), sum_square_functor<float>());
int sum = thrust::reduce(r_vec.begin(), r_vec.end(), (int)0, thrust::plus<float>());
std::cout << "sqrt(" << sum << ")=" << sqrt(sum) << std::endl;
return 0;
}
和完整错误消息是;
terminate called after throwing an instance of 'thrust::system::system_error'
what(): unspecified launch failure
代码有什么问题?有什么想法吗?
我发现错误是由generate()
引起的,但仍然无法消除错误?
答案 0 :(得分:3)
rand
是基于主机库的功能。您不能直接在设备代码中使用它。当您尝试generate
在设备向量上使用rand
时,您正在创建一个设备代码内核,该内核尝试直接使用rand
并且失败。
相反,在主机上创建这些向量并将它们复制到设备,或者使用设备兼容的随机生成器(thrust has some)。
你应该可以这样做:
host_vector<float> h_p_vec(1 << 20);
host_vector<float> h_q_vec(1 << 20);
generate(h_p_vec.begin(), h_p_vec.end(), rand);
generate(h_q_vec.begin(), h_q_vec.end(), rand);
device_vector<float> p_vec = h_p_vec;
device_vector<float> q_vec = h_q_vec;