使用Scala中的circe解码结构化JSON数组

时间:2017-09-10 19:09:52

标签: json scala circe

假设我需要解码如下所示的JSON数组,其中开头有几个字段,一些任意数量的同类元素,然后是其他字段:

[ "Foo", "McBar", true, false, false, false, true, 137 ]

我不知道为什么有人会选择像这样编码他们的数据,但人们做了奇怪的事情,并且假设在这种情况下我只需处理它。

我想将这个JSON解码为这样的案例类:

case class Foo(firstName: String, lastName: String, age: Int, stuff: List[Boolean])

我们可以这样写:

import cats.syntax.either._
import io.circe.{ Decoder, DecodingFailure, Json }

implicit val fooDecoder: Decoder[Foo] = Decoder.instance { c =>
  c.focus.flatMap(_.asArray) match {
    case Some(fnJ +: lnJ +: rest) =>
      rest.reverse match {
        case ageJ +: stuffJ =>
          for {
            fn    <- fnJ.as[String]
            ln    <- lnJ.as[String]
            age   <- ageJ.as[Int]
            stuff <- Json.fromValues(stuffJ.reverse).as[List[Boolean]]
          } yield Foo(fn, ln, age, stuff)
        case _ => Left(DecodingFailure("Foo", c.history))
      }
    case None => Left(DecodingFailure("Foo", c.history))
  }
}

......有效:

scala> fooDecoder.decodeJson(json"""[ "Foo", "McBar", true, false, 137 ]""")
res3: io.circe.Decoder.Result[Foo] = Right(Foo(Foo,McBar,137,List(true, false)))
但是,呃,那太可怕了。此外,错误消息完全没用:

scala> fooDecoder.decodeJson(json"""[ "Foo", "McBar", true, false ]""")
res4: io.circe.Decoder.Result[Foo] = Left(DecodingFailure(Int, List()))

当然有一种方法可以做到这一点,不涉及在游标和Json值之间来回切换,在我们的错误消息中丢弃历史记录,而且通常只是一个眼睛?

某些上下文:关于编写这样的自定义JSON数组解码器的问题经常出现(例如this morning)。有关如何执行此操作的具体细节可能会在即将发布的版本中更改(尽管API类似;有关详细信息,请参阅this experimental project),因此我真的不想花费大量时间在文档中添加这样的示例,但它足以让我觉得它确实值得Stack Overflow Q&amp; A.

1 个答案:

答案 0 :(得分:14)

使用游标

有更好的方法!您可以通过直接使用游标一直保持有用的错误消息来更简洁地编写这些内容:

case class Foo(firstName: String, lastName: String, age: Int, stuff: List[Boolean])

import cats.syntax.either._
import io.circe.Decoder

implicit val fooDecoder: Decoder[Foo] = Decoder.instance { c =>
  val fnC = c.downArray

  for {
    fn     <- fnC.as[String]
    lnC     = fnC.deleteGoRight
    ln     <- lnC.as[String]
    ageC    = lnC.deleteGoLast
    age    <- ageC.as[Int]
    stuffC  = ageC.delete
    stuff  <- stuffC.as[List[Boolean]]
  } yield Foo(fn, ln, age, stuff)
}

这也有效:

scala> fooDecoder.decodeJson(json"""[ "Foo", "McBar", true, false, 137 ]""")
res0: io.circe.Decoder.Result[Foo] = Right(Foo(Foo,McBar,137,List(true, false)))

但它也告诉我们错误发生的地方:

scala> fooDecoder.decodeJson(json"""[ "Foo", "McBar", true, false ]""")
res1: io.circe.Decoder.Result[Foo] = Left(DecodingFailure(Int, List(DeleteGoLast, DeleteGoRight, DownArray)))

它也更短,更具声明性,并且不需要不可读的嵌套。

如何运作

关键的想法是我们将“阅读”操作(光标上的.as[X]调用)与导航/修改操作(downArray和三个delete方法调用)交错。 / p>

当我们开始时,cHCursor,我们希望指向数组。 c.downArray将光标移动到数组中的第一个元素。如果输入根本不是数组,或者是一个空数组,则此操作将失败,我们将收到有用的错误消息。如果成功,for - 理解的第一行将尝试将第一个元素解码为字符串,并将光标指向第一个元素。

for - 理解中的第二行说“好吧,我们已经完成了第一个元素,所以让我们忘记它并转移到第二个元素”。方法名称的delete部分并不意味着它实际上正在改变任何东西 - circe中的任何内容都不会以用户可以观察到的任何方式改变任何东西 - 它只是意味着该元素将无法用于将来的任何操作结果光标。

第三行尝试将原始JSON数组中的第二个元素(现在是新游标中的第一个元素)解码为字符串。完成后,第四行“删除”该元素并移动到数组的末尾,然后第五行尝试将该最终元素解码为Int

下一行可能是最有趣的:

    stuffC  = ageC.delete

这说,好吧,我们在JSON数组的修改视图中的最后一个元素(之前我们删除了前两个元素)。现在我们删除最后一个元素并将光标向上移动,使其指向整个(修改过的)数组,然后我们可以将其解码为布尔列表,我们就完成了。

更多错误累积

实际上你可以写一个更简洁的方法:

import cats.syntax.all._
import io.circe.Decoder

implicit val fooDecoder: Decoder[Foo] = (
  Decoder[String].prepare(_.downArray),
  Decoder[String].prepare(_.downArray.deleteGoRight),
  Decoder[Int].prepare(_.downArray.deleteGoLast),
  Decoder[List[Boolean]].prepare(_.downArray.deleteGoRight.deleteGoLast.delete)
).map4(Foo)

这也可以,并且它还有一个额外的好处,即如果多个成员的解码失败,您可以同时获得所有失败的错误消息。例如,如果我们有这样的东西,我们应该期待三个错误(对于非字符串名字,非整数年龄和非布尔填充值):

val bad = """[["Foo"], "McBar", true, "true", false, 13.7 ]"""

val badResult = io.circe.jawn.decodeAccumulating[Foo](bad)

这就是我们所看到的(连同每次失败的具体位置信息):

scala> badResult.leftMap(_.map(println))
DecodingFailure(String, List(DownArray))
DecodingFailure(Int, List(DeleteGoLast, DownArray))
DecodingFailure([A]List[A], List(MoveRight, DownArray, DeleteGoParent, DeleteGoLast, DeleteGoRight, DownArray))

您应该更喜欢这两种方法中的哪一种是品味问题以及您是否关心错误累积 - 我个人认为第一种方法更具可读性。