正则表达式从字符串中拆分并提取多个部分

时间:2010-05-15 17:17:36

标签: c# .net regex

我正在尝试从下面的文字中提取“视频:”行的某些部分。

Seems stream 0 codec frame rate differs from container frame rate: 30000.00 (300
00/1) -> 14.93 (1000/67)
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'C:\a.3gp':
  Metadata:
    major_brand     : 3gp5
    minor_version   : 0
    compatible_brands: 3gp5isom
  Duration: 00:00:45.82, start: 0.000000, bitrate: 357 kb/s
    Stream #0.0(und): Video: mpeg4, yuv420p, 352x276 [PAR 1:1 DAR 88:69], 344 kb
/s, 14.93 fps, 14.93 tbr, 90k tbn, 30k tbc
    Stream #0.1(und): Audio: aac, 16000 Hz, mono, s16, 11 kb/s
    Stream #0.2(und): Data: mp4s / 0x7334706D, 0 kb/s
    Stream #0.3(und): Data: mp4s / 0x7334706D, 0 kb/s*

这是ffmpeg命令行的输出,我可以在其中获取Video:part with

private string ExtractVideoFormat(string rawInfo)
{
    string v = string.Empty;
    Regex re = new Regex("[V|v]ideo:.*", RegexOptions.Compiled);
    Match m = re.Match(rawInfo);
    if (m.Success)
    {
        v = m.Value;
    }
    return v;
}

,结果是

  

mpeg4,yuv420p,352x276 [PAR 1:1 DAR   88:69],344 kb

我想要的是以某种方式分割该行并获得

mpeg4
yuv420p
352x276 [PAR 1:1 DAR 88:69]
344 kb

分配给不同的字符串对象而不是单个

3 个答案:

答案 0 :(得分:1)

String[] words = result.Split(", " , StringSplitOptions.None)

会在数组中给出以下单词(我将它们放在新行上只是为了让它更清楚返回的内容)

MPEG4

YUV420P

352x276

[PAR 1:1 DAR 88:69]

344 kb

答案 1 :(得分:1)

我发现在开发和调试Regex时,使用正则表达式应用程序(如RegexBuddy)是一个非常有用的可视化工具:

http://www.regexbuddy.com/

答案 2 :(得分:0)

您可以使用String.Split()分割字符串。

string[] parts = String.Split(new [] { ", " }, text);

但是当我使用你的表达时,它会匹配以下内容。

  

视频:mpeg4,yuv420p,352x276 [PAR    1:1 DAR 88:69],344 kb / s,14.93 fps,    14.93 tbr,90k tbn,30k tbc Stream#0.1(und):音频:aac,16000 Hz,mono,    s16,11 kb / s流#0.2(und):数据:    mp4s / 0x7334706D,0 kb / s流    #0.3(und):数据:mp4s / 0x7334706D,0 kb / s *

这可能是由于字符串中的换行符造成的。

您可以使用以下表达式

[Vv]ideo:(,? *(?<item>[^,])+)*

并捕获命名组项中的所有有趣部分,而无需执行其他拆分。