什么可能导致P / Invoke参数在传递时出现故障?

时间:2017-06-19 22:59:57

标签: c# windows uwp arm pinvoke

这是一个特别在ARM上发生的问题,而不是在x86或x64上发生的问题。我有这个用户报告的问题,并且能够通过Windows IoT在Raspberry Pi 2上使用UWP重现它。我在使用不匹配的调用约定之前已经看到过这种问题,但是我在P / Invoke声明中指定了Cdecl,我尝试在本机上显式添加__cdecl,结果相同。以下是一些信息:

P / Invoke声明(reference):

[DllImport(Constants.DllName, CallingConvention = CallingConvention.Cdecl)]
public static extern FLSliceResult FLEncoder_Finish(FLEncoder* encoder, FLError* outError);

C#结构(reference):

internal unsafe partial struct FLSliceResult
{
    public void* buf;
    private UIntPtr _size;

    public ulong size
    {
        get {
            return _size.ToUInt64();
        }
        set {
            _size = (UIntPtr)value;
        }
    }
}

internal enum FLError
{
    NoError = 0,
    MemoryError,
    OutOfRange,
    InvalidData,
    EncodeError,
    JSONError,
    UnknownValue,
    InternalError,
    NotFound,
    SharedKeysStateError,
}

internal unsafe struct FLEncoder
{
}

C标题中的函数(reference

FLSliceResult FLEncoder_Finish(FLEncoder, FLError*);

FLSliceResult可能会导致一些问题,因为它是由值返回的,并且在本机端有一些C ++内容?

本机端的结构具有实际信息,但对于C API,FLEncoder定义为as an opaque pointer。在x86和x64上调用上面的方法时,事情顺利进行,但在ARM上,我会观察到以下内容。第一个参数的地址是SECOND参数的地址,第二个参数是null(例如,当我在C#端记录地址时,我得到,例如,0x054f59b8和0x0583f3bc,但是然后在本机端参数是0x0583f3bc和0x00000000)。什么可能导致这种乱序问题?有没有人有任何想法,因为我很难过......

以下是我重现的代码:

unsafe {
    var enc = Native.FLEncoder_New();
    Native.FLEncoder_BeginDict(enc, 1);
    Native.FLEncoder_WriteKey(enc, "answer");
    Native.FLEncoder_WriteInt(enc, 42);
    Native.FLEncoder_EndDict(enc);
    FLError err;
    NativeRaw.FLEncoder_Finish(enc, &err);
    Native.FLEncoder_Free(enc);
}

使用以下代码运行C ++应用程序可以正常工作:

auto enc = FLEncoder_New();
FLEncoder_BeginDict(enc, 1);
FLEncoder_WriteKey(enc, FLSTR("answer"));
FLEncoder_WriteInt(enc, 42);
FLEncoder_EndDict(enc);
FLError err;
auto result = FLEncoder_Finish(enc, &err);
FLEncoder_Free(enc);

这个逻辑可以用最新的developer build触发崩溃,但遗憾的是我还没有想出如何通过Nuget可靠地提供本机调试符号,以便它可以逐步完成(仅从源代码构建所有内容)似乎这样做...)所以调试有点尴尬,因为需要构建本机和托管组件。如果有人想尝试,我愿意接受如何使这更容易的建议。但如果有人以前经历过这个或者对于为什么会发生这种情况有任何想法,请添加答案,谢谢!当然,如果有人想要一个复制案例(要么很容易构建一个不提供源步骤的案例,要么难以构建一个那样做)然后留下评论但是我不想经历一个制作过程如果没有人会使用它(我不确定在实际的ARM上运行Windows的东西有多受欢迎)

编辑有趣的更新:如果我在C#中“伪造”签名并删除第二个参数,那么第一个参数就会通过OK。

编辑2 第二个有趣的更新:如果我将大小的C#FLSliceResult定义从UIntPtr更改为ulong,那么参数将正确进入...因为ARM上的size_t应该是unsigned int。

编辑3 [StructLayout(LayoutKind.Sequential, Size = 12)]添加到C#中的定义也可以实现这一点,但为什么呢?用于此体系结构的C / C ++中的sizeof(FLSliceResult)返回8。在C#中设置相同的大小会导致崩溃,但将其设置为12可以使其正常工作。

编辑4 我最小化了测试用例,以便我也可以编写C ++测试用例。在C#UWP中,它失败了,但在C ++ UWP中它成功了。

编辑5 Here是用于比较的C ++和C#的反汇编指令(虽然C#我不知道要花多少钱所以我错误地采取了太多措施)

编辑6 进一步的分析表明,在“好”运行期间,当我撒谎并说结构在C#上是12个字节时,返回值将传递给寄存器r0,其他两个参数通过r1,r2进来。然而,在糟糕的运行中,这被转移,以便两个args通过r0,r1进入并且返回值是在其他地方(堆栈指针?)

编辑7 我咨询了Procedure Call Standard for the ARM Architecture。我发现这句话:“一个大于4个字节的复合类型,或者调用者和调用者无法静态确定其大小 callee,在调用函数时作为额外参数传递的地址存储在内存中(§5.5, 规则A.4)。在函数调用期间的任何时候都可以修改用于结果的内存。“这意味着传入r0是正确的行为,因为额外的参数意味着第一个(因为C调用约定没有办法指定我猜想CLR是否会将此与另一条关于基本 64位数据类型的规则相混淆:“双字大小的基本数据类型(例如,long long,double和64) -bit容器化矢量)是 在r0和r1中返回。“

编辑8 好的,有很多证据表明CLR在这里做错了,所以我提交了bug report。我希望有人注意到在该回购邮件上发布问题的所有自动机器人之间:-S。

1 个答案:

答案 0 :(得分:1)

我在GH上提出的问题已经存在了很长一段时间。我相信这种行为只是一个错误,不需要花费更多的时间来研究它。