结合正则表达式

时间:2011-01-17 09:08:50

标签: c# asp.net regex

我有两个regualar rexpressions我想组合成一个性能游戏但不确定如何实现。第一个表达式查找html中的所有图像,第二个表达式查找所有类型为image的输入按钮。

  1. Regex.Matches(html, @"<img[^>]*?src\s*=\s*[""']?([^'"" >]+?)[ '""][^>]*?>", RegexOptions.IgnoreCase | RegexOptions.Singleline);
  2. Regex.Matches(html, @"<input[^>]*?src\s*=\s*[""']?([^'"" >]+?)[ '""][^>]*?>", RegexOptions.IgnoreCase | RegexOptions.Singleline);
  3. 我怎么能把这些结合起来?

2 个答案:

答案 0 :(得分:1)

您应该考虑使用Html Agility Pack快速正确地解析html文档:

http://htmlagilitypack.codeplex.com/

答案 1 :(得分:0)

你写它的方式有点模棱两可......但是我可以告诉你想要一个包含图像类型的图像和输入按钮的列表。 (不确定图像类型的输入按钮是什么意思?

所以你可以把括号和一个或两个放在

之间

ie ..(regex1 | regex2)

根据标签内容的具体具体情况,您也可以使用

<(?:img|input)[^>]*?src\s*=\s*[""']?([^'"" >]+?)[ '""][^>]*?>