去等同于PHP preg_match

时间:2015-02-25 09:37:09

标签: php regex go

我有一个小的PHP脚本通过我的apache日志运行 - 我正在尝试将此脚本转换为Go。但是,我在找到与PHP函数preg_match相当的好处时遇到了一些困难。

在我的PHP脚本中,我在日志文件的每一行上运行preg_match,如下所示:

preg_match('/([.0-9]+) .*?\[([0-9a-zA-Z:\/+ ]+)\].*?"[A-Z]+ \/([^\/ ]+)\/([a-zA-Z0-9\-.]+).*" ([0-9]{3}) .*"(.*?)"$/', $line, $matches)

在此日志上运行此表达式:

  

100.100.100.100 - - [23 / Feb / 2015:03:03:56 +0100]“GET /folder/file.mp3 HTTP / 1.1”206 5637064“ - ”“AppleCoreMedia / 1.0.0.12B466(iPhone; U; CPU OS 8_1_3,如Mac OS X; da_dk)“

返回以下数组(我只对[1-6]感兴趣:

Array
(
    [0] => 100.100.100.100 - - [23/Feb/2015:03:03:56 +0100] "GET /folder/file.mp3 HTTP/1.1" 206 5637064 "-" "AppleCoreMedia/1.0.0.12B466 (iPhone; U; CPU OS 8_1_3 like Mac OS X; da_dk)"
    [1] => 100.100.100.100
    [2] => 23/Feb/2015:03:03:56 +0100
    [3] => folder
    [4] => file.mp3
    [5] => 206
    [6] => AppleCoreMedia/1.0.0.12B466 (iPhone; U; CPU OS 8_1_3 like Mac OS X; da_dk)
)

所以我的问题是 - 在Go中是否有相当的优势?我已经尝试了一些不同的正则表达式方法,但似乎找不到适合我的方法。

由于

1 个答案:

答案 0 :(得分:5)

首先你需要知道你可能需要修改正则表达式模式本身,因为go的正则表达式引擎与PHP的正则表达式引擎的行为并不完全相同。两者都在使用PCRE正则表达式,其中PHP实现了比go更多的功能。但是,示例中的模式应该无需修改即可。

这里有一个示例程序,就像PHP的preg_match()

一样
package main

import "fmt"
import "regexp"

func main() {

    str := `100.100.100.100 - - [23/Feb/2015:03:03:56 +0100] "GET /folder/file.mp3 HTTP/1.1" 206 5637064 "-" "AppleCoreMedia/1.0.0.12B466 (iPhone; U; CPU OS 8_1_3 like Mac OS X; da_dk)"`

    r, _ := regexp.Compile(`([.0-9]+) .*?\[([0-9a-zA-Z:\/+ ]+)\].*?"[A-Z]+ \/([^\/ ]+)\/([a-zA-Z0-9\-.]+).*" ([0-9]{3}) .*"(.*?)"$`)

    // Using FindStringSubmatch you are able to access the 
    // individual capturing groups
    for index, match := range r.FindStringSubmatch(str) {
        fmt.Printf("[%d] %s\n", index, match)
    }   
}

<强>输出:

[0] 100.100.100.100 - - [23/Feb/2015:03:03:56 +0100] "GET /folder/file.mp3 HTTP/1.1" 206 5637064 "-" "AppleCoreMedia/1.0.0.12B466 (iPhone; U; CPU OS 8_1_3 like Mac OS X; da_dk)"
[1] 100.100.100.100
[2] 23/Feb/2015:03:03:56 +0100
[3] folder
[4] file.mp3
[5] 206
[6] AppleCoreMedia/1.0.0.12B466 (iPhone; U; CPU OS 8_1_3 like Mac OS X; da_dk)

请查看有关go regexes的手册:http://golang.org/pkg/regexp/