CUDAfy.Net / OpenCL,包含字节数组的结果导致非blittable异常

时间:2014-06-22 21:00:50

标签: c# arrays struct opencl cudafy.net

好的,我正在使用CUDAfy.Net,我有以下3种结构:

[Cudafy]
public struct Collider
{
    public int Index;
    public int Type;
    public Sphere Sphere;
    public Plane Plane;
    public Material Material;
}

[Cudafy]
public struct Material
{
    public Color Color;
    public Texture Texture;
    public float Shininess;
}

[Cudafy]
public struct Texture
{
    public int Width, Height;
    public byte[ ] Data;
}

现在,只要我将一组Collider对象发送到GPU,就使用

CopyToDevice<GPU.Collider>( ColliderArray );

我收到以下错误:

An unhandled exception of type 'System.ArgumentException' occurred in mscorlib.dll
Additional information: Object contains non-primitive or non-blittable data.

有没有任何CUDAfy.Net或OpenCL经验的人(因为它基本上编译成OpenCL),有任何想法我怎么能做到这一点?整个问题在于Texture的字节数组,因为当我没有Texture结构时,一切都运行得很好,据我所知,数组是非blittable部分。 我找到了几个关于同一问题的问题,他们使用固定大小的数组修复了它。但是,我无法做到这一点,因为这些纹理可能会有很大的变化。

编辑: 现在,我正在CPU上执行以下操作:

    public unsafe static GPU.Texture CreateGPUTexture( Cudafy.Host.GPGPU _GPU, System.Drawing.Bitmap Image )
    {
        GPU.Texture T = new GPU.Texture( );
        T.Width = Image.Width;
        T.Height = Image.Height;
        byte[ ] Data = new byte[ Image.Width * Image.Height * 3 ];


        for ( int X = 0; X < Image.Width; X++ )
            for ( int Y = 0; Y < Image.Height; Y++ )
            {
                System.Drawing.Color C = Image.GetPixel( X, Y );
                int ID = ( X + Y * Image.Width ) * 3;
                Data[ ID ] = C.R;
                Data[ ID + 1 ] = C.G;
                Data[ ID + 2 ] = C.B;
            }

        byte[ ] _Data = _GPU.CopyToDevice<byte>( Data );
        IntPtr Pointer = _GPU.GetDeviceMemory( _Data ).Pointer;
        T.Data = ( byte* )Pointer.ToPointer( );

        return T;
    }

然后我将此Texture结构附加到碰撞器,并将它们发送到GPU。这一切都没有任何错误。 但是,只要我尝试在GPU上使用纹理,就像这样:

    [Cudafy]
    public static Color GetTextureColor( int X, int Y, Texture Tex )
    {
        int ID = ( X + Y * Tex.Width ) * 3;
        unsafe
        {
            byte R = Tex.Data[ ID ];
            byte G = Tex.Data[ ID + 1 ];
            byte B = Tex.Data[ ID + 2 ];

            return CreateColor( ( float )R / 255f, ( float )G / 255f, ( float )B / 255f );
        }
    }

我收到以下错误:

An unhandled exception of type 'Cloo.InvalidCommandQueueComputeException' occurred in Cudafy.NET.dll
Additional information: OpenCL error code detected: InvalidCommandQueue.

顺便说一句,Texture结构看起来像这样:

    [Cudafy]
    public unsafe struct Texture
    {
        public int Width, Height;
        public byte* Data;
    }

我再次完全不知所措..

1 个答案:

答案 0 :(得分:0)

Cudafy尚不支持数组。所以你不能使用&#34; public byte [] Data&#34;既不是结构也不是内核本身。你可以尝试减少面向对象。我的意思是尝试从structre本身删除数据数组并单独复制它们。例如 copyToDevice(&#34;纹理属性&#34;)然后复制相应的数据数组copyToDevice(&#34;纹理数据&#34;)

编辑:好的,我找到了一个解决方案,但它不是漂亮的代码。

当您获得存储在GPU mem中的数据指针时。把他投入到整数值指针.ToInt64();并将此值存储在Structure对象中,只需将其作为long值(不是长指针)。您可以使用GThread.InsertCode()方法直接将代码插入到内核中而无需编译。您不能直接在内核代码中使用指针,因为它们不是blittable数据类型。所以在这里停止说话就是我工作代码的例子

class Program
{
    [Cudafy]
    public struct TestStruct
    {
        public double value;
        public long dataPointer; // your data pointer adress
    }

    [Cudafy]
    public static void kernelTest(GThread thread, TestStruct[] structure, int[] intArray)
    {
        // Do something 
        GThread.InsertCode("int* pointer = (int*)structure[0].dataPointer;");
        GThread.InsertCode("structure[0].value = pointer[1];");             // Here you can acces your data using pointer pointer[0], pointer[1] and so on
    }


    private unsafe static void Main(string[] args)
    {

            GPGPU gpuCuda = CudafyHost.GetDevice(eGPUType.Cuda, 0);
            CudafyModule km = CudafyTranslator.Cudafy();
            gpuCuda.LoadModule(km);

            TestStruct[] host_array = new TestStruct[1];
            host_array[0] = new TestStruct();

            int[] host_intArray = new[] {1, 8, 3};
            int[] dev_intArray = gpuCuda.CopyToDevice(host_intArray);

            DevicePtrEx p = gpuCuda.GetDeviceMemory(dev_intArray);
            IntPtr pointer = p.Pointer;

            host_array[0].dataPointer = pointer.ToInt64();


            TestStruct[] dev_array = gpuCuda.Allocate(host_array);
            gpuCuda.CopyToDevice(host_array, dev_array);

            gpuCuda.Launch().kernelTest(dev_array, dev_intArray);

            gpuCuda.CopyFromDevice(dev_array, host_array);

            Console.WriteLine(host_array[0].value);

            Console.ReadKey();
    }
}

&#34;魔法&#34;在InsertCode()中,您将long dataPointer值转换为int指针地址...但这种方法的缺点是您必须将这些代码部分写为String。

或者您可以分离您的数据和结构,例如

[Cudafy]
public struct Texture
{
    public int Width, Height;
}

[Cudafy]
    public static void kernelTest(GThread thread, Texture[] TexStructure, byte[] Data)
    {....}

简单地复制

dev_Data = gpu.CopyToDevice(host_Data);
dev_Texture = gpu.CopyToDevice(host_Texture);
gpu.Launch().kernelTest(dev_Texture, dev_Data);

编辑二:忘记我的代码:D

检查https://cudafy.codeplex.com/discussions/538310 这是你的问题的解决方案 https://cudafy.codeplex.com/discussions/283527