当尝试使用推力zip迭代器压缩多个CUDA数组时,我遇到了一个令人困惑的错误。我的情况很简单:我有一个推力::整数向量表示一个对象的状态,六个浮点向量表示对象在3D中的位置和速度。当status(整数)向量元素的值为1时,我想从所有向量中删除该元素并收缩向量。
关注this example,我使用7路元组和谓词。
// Predicate
struct isTupleFlagged
{
__host__ __device__ bool operator() ( const PartTuple& tup )
{
const int x = thrust::get<0>( tup );
return ( x == 1 );
}
};
void ParticleSystem::RemoveFlaggedParticles()
{
typedef thrust::device_vector< int >::iterator IntDIter;
typedef thrust::device_vector< float >::iterator FloatDIter;
typedef thrust::tuple< IntDIter, FloatDIter, FloatDIter, FloatDIter, FloatDIter, FloatDIter, FloatDIter > PartDIterTuple;
typedef thrust::zip_iterator< PartDIterTuple > ZipDIter;
ZipDIter newEnd = thrust::remove_if( thrust::make_zip_iterator( thrust::make_tuple( exit.begin(), x.begin(), y.begin(), z.begin(), vx.begin(), vy.begin(), vz.begin() ) ),
thrust::make_zip_iterator( thrust::make_tuple( exit.end(), x.end(), y.end(), z.end(), vx.end(), vy.end(), vz.end() ) ),
isTupleFlagged() );
PartDIterTuple endTuple = newEnd.get_iterator_tuple();
exit.erase(thrust::get<0>( endTuple ), exit.end());
x.erase( thrust::get<1>( endTuple ), x.end() );
y.erase( thrust::get<2>( endTuple ), y.end() );
z.erase( thrust::get<3>( endTuple ), z.end() );
vx.erase( thrust::get<4>( endTuple ), vx.end() );
vy.erase( thrust::get<5>( endTuple ), vy.end() );
vz.erase( thrust::get<6>( endTuple ), vz.end() );
}
然而,这似乎错误地删除了额外的元素。例如,当向量为100时存在单个标记对象时,向量的紧凑后大小为52,而不是人们所期望的99。我错过了什么?