RegEx元素之间的空白区域

时间:2014-03-02 18:50:02

标签: c# regex

我将html页面保存为文本,我想使用RegEx从文件中提取名称。由于元素之间的空白,我认为没有任何东西被归还。我试图在span和anchor之间添加\s*。请帮助我解决它......

以下是html的示例:

<li>
     <span class="name">
           <a href="/players/player-name.html">Stanley,&nbsp;Kyle</a>
     </span>
</li>

我正在使用C#,这是我的代码:

        static void Main(string[] args)
    {
        using (StreamReader r = new StreamReader(@"textfile.txt"))
        {

            string content = r.ReadToEnd();

            Regex r1 = new Regex("<span class=\"name\"><a.*>(.*?)</a></span>");

            MatchCollection mc = r1.Matches(content);
            foreach (Match m in mc)
            {
                Console.WriteLine(m.Groups[1].Value);
            }
        }
        Console.ReadLine();
        Console.WriteLine();

    }

1 个答案:

答案 0 :(得分:1)

Regex r1 = new Regex(
  @"<span class=""name"">\s*<a.*?>(.*?)</a>\s*</span>",
  RegexOptions.Multiline
);