我正在尝试遍历JSON并提取有关字段中对象类型的信息:
import org.json4s._
import org.json4s.JsonAST.{JArray, JString, JObject, JInt, JBool, JDouble}
import org.json4s.JsonDSL._
import org.json4s.native.JsonMethods._
def guessTypes(example: JValue): JObject = example match {
case JObject(lst) => JObject(lst.map {
case (f, JObject(nested)) => JField(f, ("type" -> "object") ~ ("properties" -> guessTypes(nested)))
case (f, JString(s)) => JField(f, "type" -> "string")
case (f, JInt(num)) => JField(f, "type" -> "integer")
case (f, JDouble(double)) => JField(f, "type" -> "double")
case (f, JBool(b)) => JField(f, "type" -> "bool")
case (f, JArray(jarray: List[JInt])) => JField(f, ("type" -> "array") ~ ("items" -> "integer"))
case (f, JArray(jarray: List[JString])) => JField(f, ("type" -> "array") ~ ("items" -> "string"))
case (f, JArray(jarray: List[JObject])) => JField(f, ("type" -> "array") ~ ("items" -> "object")) ~ ("properties" -> jarray.map{ x => guessTypes(x)}))
})}
如果:
def example = """
|{
| "partners_data": [
| {
| "info": {
| "label": "partner45"
| },
| "partner_id": "partner45",
| "data": {
| "field": 24
| }
| }
| ],
| "name": "*****(",
| "location": [
| 1,
| 2
| ],
| "is_mapped": false
|}
""".stripMargin
结果获得:
{ “数据”:{ “类型”: “阵列”, “项目”: “对象”}, “名称”:{ “类型”: “串”}, “位置”:{ “类型”:”阵列”, “项目”: “对象”}, “is_mapped”:{ “类型”: “布尔”}}
这不是合适的结果,因为对于“位置”值中的关键“项目”,预期值为“整数”。
看起来Scala无法区分JArrays中除JValue之外的任何其他内容。如果我替换
case(f,JArray(jarray:List [JInt]))
通过最后一个字符串,对于“位置”值中的关键“项目”将获得“对象”,但对于其他字段,值将是错误的。
如何绕过scala模式匹配和json4s框架的这种特性?
答案 0 :(得分:1)
由于JVM上的type erasure,最后三个模式基本相同。
由于JSON数组可以包含多个(Scala / Java / ...)类型,因此很难匹配列表元素的类型。
您只能检查数组的第一项:
case (f, JArray(JString(_) :: tail)) =>
JField(f, ("type" -> "array") ~ ("items" -> "string"))
case (f, JArray(jarray @ JObject(_) :: tail)) =>
JField(f, ("type" -> "array") ~ ("items" -> "object") ~ ("properties" -> jarray.map(guessTypes)))
或检查数组中的每个项目:
case (f, JArray(list : List[JValue])) if list forall { case JInt(_) => true; case _ => false } =>
JField(f, ("type" -> "array") ~ ("items" -> "integer"))