2行正则表达式

时间:2015-12-08 08:42:54

标签: regex powershell

我正在尝试在文本文件中搜索2行文本(一行始终放在另一行)。一行始终相同:#EXTINF:Discovery Science。然而第二个总是不同但有以下模式:“http://”ipaddress“:”一些随机端口IP地址“:”随机端口

示例:

#EXTINF:Discovery Science http://95.188.124.44:1234/udp/233.7.70.27:5000

这是我的代码:

$file = "C:\1.m3u"
$Text = [IO.File]::ReadAllText($file) 
[regex]$reg = "([#EXTINF:Discovery Science http://\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b])"
$match = $reg.match($Text)  
$array = @()
$array = new-object collections.arraylist
$array = while ($match.Success)  
{            
    $match.Groups[1].value            
    $match = $match.nextMatch()
    write-host $match
}

1 个答案:

答案 0 :(得分:4)

为了匹配任何空格,您可以使用\s+(1个或更多空格)。此外,我假设#EXTINF:Discovery Science文本是已知的,因此使用捕获组捕获它是没有意义的,我建议在(之前移动http

另一点是\b在此表达式中是多余的,其中最糟糕的部分是由[...]形成的字符类。请注意,字符类匹配方括号内指定符号集中的1个符号。你只需要删除它们。

这是一个返回http://95.188.124.44的工作演示:

$Text = "#EXTINF:Discovery Science`r`nhttp://95.188.124.44:1234/udp/233.7.70.27:5000"
[regex]$reg = "#EXTINF:Discovery Science\s+(http://\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})"
$match = $reg.match($Text)  
$array = @()
$array = new-object collections.arraylist
$array = while ($match.Success)  
{            
    write-host $match.Groups[1].value            
    $match = $match.nextMatch()
}

如果您需要添加端口号:5000,只需将:\d+添加到正则表达式:

[regex]$reg = "#EXTINF:Discovery Science\s+(http://\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}:\d+)"

如果您只需要在http 之后抓取一个或多个非空格符号,请使用:

[regex]$reg = "#EXTINF:Discovery Science\s+(http://\S+)"