我是正则表达式(C#)的新手。我需要从HTML文档中获取品牌名称。我正在使用
MatchCollection m1 = Regex.Matches(html,"<td>.+?</td>",RegexOptions.Singleline);
,结果是108行,类似于以下内容。每个包含不同的品牌名称,在这种情况下是Acer。
<td><a href=acer-phones-59.php>
<img src="http://cdn2.gsmarena.com/vv/logos/lg_acer.gif"
width=92 height=22 border=0 alt="Acer"></a></td>
<td><a href=acer-phones-59.php>Acer phones (89)</a></td>
我需要&#34; acer&#34;只有一次,&#34; acer-phones-59.php&#34;只有一次。 如何调整表达式以获取每行的品牌名称和参考名称。非常感谢任何帮助,谢谢。
答案 0 :(得分:-1)
Regex.Matches( inputString, @"<td>(.|\n)+?href=(.+?)>(.|\n)+?alt="(.+)"", RegexOptions.None )
答案在Group2和Group4中。