在Golang中解析格式化的字符串

时间:2014-07-31 22:59:51

标签: parsing go formatted

我正在尝试使用Golang解析GNSS RINEX文件。

例如,这是VERSION行的RINEX规范:

+--------------------+------------------------------------------+------------+
|RINEX VERSION / TYPE| - Format version (2.11)                  | F9.2,11X,  |
|                    | - File type ('O' for Observation Data)   |   A1,19X,  |
|                    | - Satellite System: blank or 'G': GPS    |   A1,19X   |
|                    |                     'R': GLONASS         |            |
|                    |                     'S': Geostationary   |            |
|                    |                          signal payload  |            |
|                    |                     'E': Galileo         |            |
|                    |                     'M': Mixed           |            |
+--------------------+------------------------------------------+------------+

RINEX文件中的每一行都有固定宽度为80个ASCII字符+“\ n”。在此示例中,前9个字符表示版本号(浮点数)。

在Python中我可能会使用:

struct.unpack("9s11s1s19s1s19s20s", line)

将返回一个包含7个字符串的元组。

我刚开始尝试使用fmt.Sscanf读取格式化文本:

func main() {
    str := "     2.11           OBSERVATION DATA    G (GPS)             RINEX VERSION / TYPE\n"
    var value float32
    a, err := fmt.Sscanf(str,"%9.2f", &value)
    fmt.Println(a)
    fmt.Println(err)
    fmt.Println(value)
}

返回:

0
bad verb %. for float32
0

是否有任何包允许解析固定宽度的数据?

如果没有,那么编写类似于Python结构的东西可能是一个好方法吗?

1 个答案:

答案 0 :(得分:4)

例如,

package main

import (
    "errors"
    "fmt"
    "strconv"
    "strings"
)

// http://gage14.upc.es/gLAB/HTML/LaunchHTML.html
// http://gage14.upc.es/gLAB/HTML/Observation_Rinex_v2.11.html

func parseVersionType(line string) (version float64, fileType, satellite, label string, err error) {
    label = line[60:80]
    if label != "RINEX VERSION / TYPE" {
        err = errors.New("Unknown header label")
        return
    }
    version, err = strconv.ParseFloat(strings.TrimSpace(line[0:9]), 64)
    if err != nil {
        return
    }
    fileType = line[20:21]
    satellite = line[40:41]
    return
}

func main() {
    line := "     2.11           OBSERVATION DATA    G (GPS)             RINEX VERSION / TYPE\n"
    version, fileType, satellite, label, err := parseVersionType(line)
    fmt.Printf("%g %q %q %q %v\n", version, fileType, satellite, label, err)
}

输出:

2.11 "O" "G" "RINEX VERSION / TYPE" <nil>