使用推力zip_iterator进行CUDA阵列压缩的问题

时间:2014-06-17 06:22:35

标签: c++ vector cuda thrust stream-compaction

当尝试使用推力zip迭代器压缩多个CUDA数组时,我遇到了一个令人困惑的错误。我的情况很简单:我有一个推力::整数向量表示一个对象的状态,六个浮点向量表示对象在3D中的位置和速度。当status(整数)向量元素的值为1时,我想从所有向量中删除该元素并收缩向量。

关注this example,我使用7路元组和谓词。

// Predicate
struct isTupleFlagged
{
    __host__ __device__ bool operator() ( const PartTuple& tup )
    {
        const int x = thrust::get<0>( tup );
        return ( x == 1 );
    }
};

void ParticleSystem::RemoveFlaggedParticles()
{
        typedef thrust::device_vector< int >::iterator  IntDIter;
        typedef thrust::device_vector< float >::iterator  FloatDIter;
        typedef thrust::tuple< IntDIter, FloatDIter, FloatDIter, FloatDIter, FloatDIter, FloatDIter, FloatDIter >     PartDIterTuple;
        typedef thrust::zip_iterator< PartDIterTuple >  ZipDIter;

        ZipDIter newEnd = thrust::remove_if(    thrust::make_zip_iterator( thrust::make_tuple( exit.begin(), x.begin(), y.begin(), z.begin(), vx.begin(), vy.begin(), vz.begin() ) ),
                                                thrust::make_zip_iterator( thrust::make_tuple( exit.end(), x.end(), y.end(), z.end(), vx.end(), vy.end(), vz.end() ) ),
                                                isTupleFlagged() );

        PartDIterTuple endTuple = newEnd.get_iterator_tuple();
        exit.erase(thrust::get<0>( endTuple ), exit.end());
        x.erase( thrust::get<1>( endTuple ), x.end() );
        y.erase( thrust::get<2>( endTuple ), y.end() );
        z.erase( thrust::get<3>( endTuple ), z.end() );
        vx.erase( thrust::get<4>( endTuple ), vx.end() );
        vy.erase( thrust::get<5>( endTuple ), vy.end() );
        vz.erase( thrust::get<6>( endTuple ), vz.end() );

}

然而,这似乎错误地删除了额外的元素。例如,当向量为100时存在单个标记对象时,向量的紧凑后大小为52,而不是人们所期望的99。我错过了什么?

0 个答案:

没有答案