解析plist xml

时间:2016-07-29 11:38:19

标签: go xml-parsing plist

如何以这种愚蠢的格式解析xml:

<key>KEY1</key><string>VALUE OF KEY1</string>
<key>KEY2</key><string>VALUE OF KEY2</string>
<key>KEY3</key><integer>42</integer>
<key>KEY3</key><array>
    <integer>1</integer>
    <integer>2</integer>
</array>

如果所有值都具有相同的类型(例如字符串),则解析将非常简单。但在我的情况下,每个值可以是字符串,数据,整数,布尔值,数组或字典。

这个xml看起来几乎像json,但不幸的是格式是固定的,我无法改变它。我更喜欢没有任何外部包装的解决方案。

2 个答案:

答案 0 :(得分:1)

使用encoding/xml提供的低级解析接口,允许您迭代XML流中的各个令牌(例如“start element”,“end element”等)。

请参阅Token()的{​​{1}}类型的encoding/xml方法。

答案 1 :(得分:0)

由于数据结构不合理,并且您无法修改格式,因此无法使用xml.Unmarshal,因此可以通过创建新的Decoder来处理XML元素,然后迭代标记并使用DecodeElement逐个处理它们。在下面的示例代码中,它将所有内容放在地图中。代码也在github here ...

package main

import (
        "encoding/xml"
    "strings"
    "fmt"
)

type PlistArray struct {
    Integer []int  `xml:"integer"`
}

const in = "<key>KEY1</key><string>VALUE OF KEY1</string><key>KEY2</key><string>VALUE OF KEY2</string><key>KEY3</key><integer>42</integer><key>KEY3</key><array><integer>1</integer><integer>2</integer></array>"

func main() {
    result := map[string]interface{}{}
    dec := xml.NewDecoder(strings.NewReader(in))
    dec.Strict = false
    var workingKey string

    for {
        token, _ := dec.Token()
        if token == nil {
            break
        }
        switch start := token.(type) {
        case xml.StartElement:
            fmt.Printf("startElement = %+v\n", start)
            switch start.Name.Local {
            case "key":
                var k string
                err := dec.DecodeElement(&k, &start)
                if err != nil {
                    fmt.Println(err.Error())
                }
                workingKey = k
            case "string":
                var s string
                err := dec.DecodeElement(&s, &start)
                if err != nil {
                    fmt.Println(err.Error())
                }
                result[workingKey] = s
                workingKey = ""
            case "integer":
                var i int
                err := dec.DecodeElement(&i, &start)
                if err != nil {
                    fmt.Println(err.Error())
                }
                result[workingKey] = i
                workingKey = ""
            case "array":
                var ai PlistArray
                err := dec.DecodeElement(&ai, &start)
                if err != nil {
                    fmt.Println(err.Error())
                }
                result[workingKey] = ai
                workingKey = ""
            default:
                fmt.Errorf("Unrecognized token")
            }
        }
    }
    fmt.Printf("%+v", result)

}