正则表达式否定集不工作golang

时间:2017-11-09 20:31:41

标签: regex go

我有一个正则表达式,我在一些在线正则表达式解析器中验证了

https://regexr.com/3h5h8

^(.*\.(?!(htm|html|class|js)$))?[^.]

如何在golang中实现这一点与在线正则表达式解析器的实现方式不一样

package main

import (
    "fmt"
    "regexp"
    "strconv"
)

type ParsedConfigFile struct {
    prefix      string
    instanceNum int
    extension   string
}

// tries to guess config type and instance id from files
func parseFiles(files []string) {
    re := regexp.MustCompile(`(type1|type2)_(\d+)\.(csv|ini)`)
    var matchedFiles []ParsedConfigFile

    for _, file := range files {
        match := re.FindStringSubmatch(file)

        // we have 3 groups we try to capture in the regex + 1 for the full match
        EXPECTED_MATCH_COUNT := 4

        if len(match) == EXPECTED_MATCH_COUNT {
            fmt.Printf("trying: %v\n", file)
            instanceNum, strConvErr := strconv.Atoi(match[2])

            if strConvErr == nil {
                matchedFiles = append(matchedFiles, ParsedConfigFile{
                    prefix:      match[1],
                    instanceNum: instanceNum,
                    extension:   match[3],
                })
            }
        }

    }
}

func main() {
    files := []string{
        "type1_12.ini",          // match
        "type1_121111.ini",      // match
        "type2_1233.csv",        // match
        "type2_32.csv",          // match
        "type1_.ini",            // don't match
        "type2_32.csv.20141027", // don't match
        "type1_12.",             // don't match
        "_12.ini.",              // don't match
        "_12.ini.11",            // don't match
        "type1_81.ini.20141028", //dont match
        "XNGS.csv",              // don't match
    }

    parseFiles(files)
}

删除否定集会产生一些结果,但我不确定我要做什么模仿其他正则表达式解析器中的行为或忽略文件名末尾的匹配

游乐场链接 https://play.golang.org/p/6HxutLjnLd

1 个答案:

答案 0 :(得分:2)

Go的stdlib regexp引擎是RE2,它不支持环视(例如?!负前瞻运算符)。您可以在文档中找到完整的受支持的正则表达式语法集:https://golang.org/pkg/regexp/syntax/

如果您只需要确保字符串以三个字符的文件扩展名结尾,那么您可以将表达式简化为\.\w{3}$ - 一个文字句点,后跟三个字符,然后是结尾字符串。