我有一个小的PHP脚本通过我的apache日志运行 - 我正在尝试将此脚本转换为Go。但是,我在找到与PHP函数preg_match
相当的好处时遇到了一些困难。
在我的PHP脚本中,我在日志文件的每一行上运行preg_match
,如下所示:
preg_match('/([.0-9]+) .*?\[([0-9a-zA-Z:\/+ ]+)\].*?"[A-Z]+ \/([^\/ ]+)\/([a-zA-Z0-9\-.]+).*" ([0-9]{3}) .*"(.*?)"$/', $line, $matches)
在此日志上运行此表达式:
100.100.100.100 - - [23 / Feb / 2015:03:03:56 +0100]“GET /folder/file.mp3 HTTP / 1.1”206 5637064“ - ”“AppleCoreMedia / 1.0.0.12B466(iPhone; U; CPU OS 8_1_3,如Mac OS X; da_dk)“
返回以下数组(我只对[1-6]感兴趣:
Array
(
[0] => 100.100.100.100 - - [23/Feb/2015:03:03:56 +0100] "GET /folder/file.mp3 HTTP/1.1" 206 5637064 "-" "AppleCoreMedia/1.0.0.12B466 (iPhone; U; CPU OS 8_1_3 like Mac OS X; da_dk)"
[1] => 100.100.100.100
[2] => 23/Feb/2015:03:03:56 +0100
[3] => folder
[4] => file.mp3
[5] => 206
[6] => AppleCoreMedia/1.0.0.12B466 (iPhone; U; CPU OS 8_1_3 like Mac OS X; da_dk)
)
所以我的问题是 - 在Go中是否有相当的优势?我已经尝试了一些不同的正则表达式方法,但似乎找不到适合我的方法。
由于
答案 0 :(得分:5)
首先你需要知道你可能需要修改正则表达式模式本身,因为go的正则表达式引擎与PHP的正则表达式引擎的行为并不完全相同。两者都在使用PCRE正则表达式,其中PHP实现了比go更多的功能。但是,示例中的模式应该无需修改即可。
这里有一个示例程序,就像PHP的preg_match()
:
package main
import "fmt"
import "regexp"
func main() {
str := `100.100.100.100 - - [23/Feb/2015:03:03:56 +0100] "GET /folder/file.mp3 HTTP/1.1" 206 5637064 "-" "AppleCoreMedia/1.0.0.12B466 (iPhone; U; CPU OS 8_1_3 like Mac OS X; da_dk)"`
r, _ := regexp.Compile(`([.0-9]+) .*?\[([0-9a-zA-Z:\/+ ]+)\].*?"[A-Z]+ \/([^\/ ]+)\/([a-zA-Z0-9\-.]+).*" ([0-9]{3}) .*"(.*?)"$`)
// Using FindStringSubmatch you are able to access the
// individual capturing groups
for index, match := range r.FindStringSubmatch(str) {
fmt.Printf("[%d] %s\n", index, match)
}
}
<强>输出:强>
[0] 100.100.100.100 - - [23/Feb/2015:03:03:56 +0100] "GET /folder/file.mp3 HTTP/1.1" 206 5637064 "-" "AppleCoreMedia/1.0.0.12B466 (iPhone; U; CPU OS 8_1_3 like Mac OS X; da_dk)"
[1] 100.100.100.100
[2] 23/Feb/2015:03:03:56 +0100
[3] folder
[4] file.mp3
[5] 206
[6] AppleCoreMedia/1.0.0.12B466 (iPhone; U; CPU OS 8_1_3 like Mac OS X; da_dk)
请查看有关go regexes的手册:http://golang.org/pkg/regexp/