我正在尝试使用MessagePack来序列化Erlang和Java中的整数。
在Java中,我可以填充一个数组,其中包含一个0到0的整数,MessagePack.read()
仍然返回正确的值。但是在Erlang msgpack:unpack/1
如果有任何额外的零则失败。
例如,传递msgpack:unpack/1
的{{1}}按预期返回<<10>>
。但是添加额外的零并传递{ok,10}
失败,返回<<10,0,0>>
。 API中的注释表明错误意味着术语已被解码但二进制仍然存在。
答案 0 :(得分:1)
库msgpack不是要解码原始二进制文件,而是解码以前用msgpack:pack编码的二进制文件。
原因是二进制文件本身没有结构,因此必须在其中包含一些信息才能进行解码。它就像term_to_binary这样的函数,使用erlang外部格式:
1> B = term_to_binary({12,atom,[$a,$l,$i,$s,$t]}).
<<131,104,3,97,12,100,0,4,97,116,111,109,107,0,5,97,108,
105,115,116>>
2> binary_to_term(B).
{12,atom,"alist"}
库msgpack允许使用其他编码方法。
来你的问题。 unpack和unpack_stream之间的区别在于,第一个期望二进制中的单个编码术语,而第二个假设尾随二进制包含其他编码术语。
当你调用msgpack:unpack(<<10>>)
时,它属于第一个元素小于128的情况:在这种情况下,编码值是值本身。如果您尝试使用大于127的内容,则会出现错误:
4> msgpack:unpack(<<10>>).
{ok,10}
5> msgpack:unpack(<<200>>).
{error,incomplete}
6>
当你调用msgpack:unpack_stream(<<10>>)
时,它完全相同,所以第一个元素被解码,结果为10,其余的二进制文件被提供进一步解码:
8> {A,Rest} = msgpack:unpack_stream(<<10,0>>).
{10,<<0>>}
9> msgpack:unpack_stream(Rest).
{0,<<>>}
10> msgpack:unpack_stream(<<200,0>>).
{error,incomplete}
11> msgpack:unpack_stream(<<200,0,0>>).
{error,incomplete}
12> msgpack:unpack_stream(<<200,0,0,0>>).
{error,{badarg,{bad_ext,200}}}
13>
使用该库的正确方法是首先编码您的消息:
13> Msg = msgpack:pack(<<10,0,0>>).
<<163,10,0,0>>
14> msgpack:unpack(Msg).
{ok,<<10,0,0>>}
或第一个例子:
24> Msg1 = msgpack:pack(msgpack:term_to_binary({12,atom,[$a,$l,$i,$s,$t]})).
<<183,199,20,131,131,104,3,97,12,100,0,4,97,116,111,109,
107,0,5,97,108,105,115,116>>
25> {ok,Rep1} = msgpack:unpack(Msg1).
{ok,<<199,20,131,131,104,3,97,12,100,0,4,97,116,111,109,
107,0,5,97,108,105,115,116>>}
26> msgpack:binary_to_term(Rep1).
{12,atom,"alist"}
27>
<强> [编辑] 强>
这是一个添加填充的解决方案和一个检测它的解包器。它使用unpack_stream,因为无法修改整数的编码方式。
Packer = fun(X, Opt) -> {ok, {12,<<>>}} end,
Unpacker = fun(12, _) -> {ok, padding} end,
Opt = [{ext,{Packer,Unpacker}}],
Pad = fun(B) -> Size = 10 - size(B), SB = Size*8,<<B/binary,16#C7,Size,12,0:SB>> end,
R = msgpack:pack(256897),
Var = Pad(R),
{I,Rest} = msgpack:unpack_stream(Var,Opt),
{padding,<<>>} = msgpack:unpack_stream(Rest,Opt).
答案 1 :(得分:0)
当我查看Erlang API的源代码以获取更多信息来询问这个问题时,我注意到另一个函数msgpack:unpack_stream/1
,它返回一个带有第一个解码项的元组,与无关的二进制文件配对,而不是返回一个错误。这在Java中的行为read
更多。
但我仍然想知道是否有更好的方法来解决这个问题,例如使用固定长度类型的方法。