我遇到了scodec的一个有趣问题。我有一个特殊的编码方案,当当前位指针mod 8不为零(未与最近的字节对齐)时,需要流字节对齐。
现在通常,这将由byteAligned
编解码器处理,但情况似乎需要整个解码操作的全局上下文。
这是问题的最小例子
case class Baz(abc : Int, qux : Int)
case class Foo(bar : Int,
items : Vector[Baz])
object Foo {
implicit val codec : Codec[Foo] = (
("bar" | uint8L) ::
("items" | vectorOfN(uint8L, (
("abc" | uint8L) ::
("qux" | uint2L)
).as[Baz]
))).as[Foo]
}
items
将被编码并解码为Vector
个Baz
个项目。请注意,qux
中的Baz
成员表示为2位无符号整数。我们希望abc
成员字节对齐,这意味着在解码期间,它将解码,如果字节流未对齐,则必须在解码后的位之后添加填充(案例C)
这意味着对于大小为1的向量(情况A),输出BitVector将未对齐6位,这很好,因为没有更多项(在向量解码中永远不会再次到达abc
循环)。
案例B中显示了大小为2且没有字节对齐的向量。 在案例C中显示了具有字节对齐的向量。
在每种情况下,评论都会打破比特流。 0x0a
为10十进制的十六进制,0b01
为1十进制的二进制。当需要更多细节时以及当流不是字节对齐时,我将在两者之间切换。
案例A
Codec.encode(Foo(10, Vector(Baz(4,1))))
res43: Attempt[BitVector] = Successful(BitVector(26 bits, 0x0a01044))
// bar N items abc(0) qux(0)
// 0x0a 0x01 0x04 0b01
案例B
Codec.encode(Foo(10, Vector(Baz(4,1), Baz(15,3))))
res42: Attempt[BitVector] = Successful(BitVector(36 bits, 0x0a020443f))
// bar N items abc(0) qux(0) abc(1) qux(1)
// 0x0a 0x02 0x04 0b01 0b00001111 0b11
案例C
Codec.encode(Foo(10, Vector(Baz(4,1), Baz(15,3))))
res42: Attempt[BitVector] = Successful(BitVector(42 bits, 0x0a020443c0c))
// bar N items abc(0) qux(0) abc(1) padding qux(1)
// 0x0a 0x02 0x04 0b01 0b00001111 0b000000 0b11
查看案例C的另一种方法是展开编解码器
// bar N items abc(0) qux(0) abc(1) padding qux(1)
(uint8L :: uint8L :: uint8L :: uint2L :: uint8L :: ignore(6) :: uint2L).
dropUnits.encode(10 :: 2 :: 4 :: 1 :: 15 :: 3 :: HNil)
res47: Attempt[BitVector] = Successful(BitVector(42 bits, 0x0a020443c0c))
请注意abc(0)
之后没有任何填充,因为该流在该点处是字节对齐的。在abc(1)
,由于qux(0)
的解码,它未对齐。对齐后,qux
将在对齐的边界上进行解码。我们总是希望qux
在字节对齐的位置进行解码。
我需要的是获取全局上下文以确定整个BitVector中的当前位指针是否对齐的方法。如果没有,我需要一个编解码器来智能地知道它何时没有在对齐边界上解码并在解码它的当前值之后纠正流。
我知道编解码器可以从当前比特流中进行解码,但是他们不知道它们在整个比特流中的位置。
任何方向或代码都会受到最高的赞赏。
P.S。
如果你想在Ammonite中测试,你需要这个来开始
load.ivy("org.scodec" %% "scodec-core" % "1.8.3")
import scodec.codecs._
import scodec._
import shapeless._
复制和粘贴时,您需要以{
开头,以确保同时定义案例类和案例对象。