从键值对中“过滤” JSON对象的最有效方法是什么?

时间:2018-09-25 06:22:01

标签: json go

我正在读取.json文件。它是有效JSON格式的对象数组,例如:

    [
        {
                "Id": 13,
                "Location": "Australia",
                "Content": "Another string"
        },
        {
                "Id": 145,
                "Location": "England",
                "Content": "SomeString"
        },
        {
                "Id": 12,
                "Location": "England",
                "Content": "SomeString"
        },
        {
                "Id": 12331,
                "Location": "Sweden",
                "Content": "SomeString"
        },
        {
                "Id": 213123,
                "Location": "England",
                "Content": "SomeString"
        }
     ]

我想过滤掉这些对象-例如,删除"Location"不等于"England"的所有内容。

到目前为止,我一直在尝试创建自定义UnmarshalJSON函数。它确实取消了编组,但是它产生的对象是空的,并且与输入的数量一样。

示例代码:

type languageStruct struct {
    ID                  int     `json:"Id"`
    Location            string  `json:"Location"` 
    Content             string  `json:"Content"`
}

func filterJSON(file []byte) ([]byte, error) {
    var x []*languageStruct

    err := json.Unmarshal(file, &x)
    check(err)

    return json.MarshalIndent(x, "", " ")
}


func (s *languageStruct) UnmarshalJSON(p []byte) error {

    var result struct {
        ID              int     `json:"Id"`
        Location        string  `json:"Location"` 
        Content         string  `json:"Content"`
    }

    err := json.Unmarshal(p, &result)
    check(err)

    // slice of locations we'd like to filter the objects on
    locations := []string{"England"} // Can be more 

    if sliceContains(s.Location, locations) {
        s.ID = result.ID
        s.Location= result.Location
        s.Content = result.Content
    }

    return nil
}

// helper func to check if a given string, f.e. a value of a key-value pair in a json object, is in a provided list
func sliceContains(a string, list []string) bool {
    for _, b := range list {
        if b == a {
            fmt.Println("it's a match!")
            return true
        }
    }
    return false
}

在运行时-输出错误。它会创建尽可能多的对象-但是,新对象是空的,例如:

// ...
 [
 {
  "Id": 0,
  "Location": "",
  "Content": ""
 },
 {
  "Id": 0,
  "Location": "",
  "Content": ""
 }
 ]
//...

从第一个给定的输入来看,我想要的输出将是:

[
    {
            "Id": 145,
            "Location": "England",
            "Content": "SomeString"
    },
    {
            "Id": 12,
            "Location": "England",
            "Content": "SomeString"
    },
    {
            "Id": 213123,
            "Location": "England",
            "Content": "SomeString"
    }
 ]

1 个答案:

答案 0 :(得分:4)

调用$ qmake-qt5 testQByteArray-istream.pro $ make $ ./testQByteArray-istream Qt Version: 5.9.4 Got: 'Hello Qt World.' $ 时,已经准备好将languageStruct.UnmarshalJSON()附加到切片中,无论是否填充其内容(字段)。

最简单和我建议的解决方案是正常拆组,然后对切片进行后处理:根据需要删除元素。这将产生干净的代码,您以后可以轻松调整/更改它们。尽管可以将其实现为自定义切片类型languageStruct上的自定义封送处理逻辑,但我仍然不会为此创建自定义封送处理逻辑,而是将其实现为单独的过滤逻辑。

这是一个简单的代码,再次对其进行编组,过滤和编组(注意:没有为此定义/使用自定义编组):

[]languageStruct

这将产生所需的输出。在Go Playground上尝试一下。

最快和最复杂的解决方案是使用事件驱动解析并构建状态机,但是复杂度会大大增加。这个想法是通过令牌处理JSON,跟踪您当前在对象树中的位置,以及当检测到必须排除的对象时,请勿处理/将其添加到切片中。有关如何编写的详细信息和想法,请查看以下提示:Go - Decode JSON as it is still streaming in via net/http