我将html页面保存为文本,我想使用RegEx从文件中提取名称。由于元素之间的空白,我认为没有任何东西被归还。我试图在span和anchor之间添加\s*
。请帮助我解决它......
以下是html的示例:
<li>
<span class="name">
<a href="/players/player-name.html">Stanley, Kyle</a>
</span>
</li>
我正在使用C#,这是我的代码:
static void Main(string[] args)
{
using (StreamReader r = new StreamReader(@"textfile.txt"))
{
string content = r.ReadToEnd();
Regex r1 = new Regex("<span class=\"name\"><a.*>(.*?)</a></span>");
MatchCollection mc = r1.Matches(content);
foreach (Match m in mc)
{
Console.WriteLine(m.Groups[1].Value);
}
}
Console.ReadLine();
Console.WriteLine();
}
答案 0 :(得分:1)
Regex r1 = new Regex(
@"<span class=""name"">\s*<a.*?>(.*?)</a>\s*</span>",
RegexOptions.Multiline
);