HTML正则表达式忽略标签

时间:2013-09-25 13:34:59

标签: html regex

在我的HTML文字中,我想忽略两(2)个</tr>并从开头到第三个</tr>捕获文字,我的模式是

 string regularExpressionPattern = @"\<tr class=(.*?)\</tr>";

这是输入文字。

<tr class="oddrow">
  <td>5Dimes.eu</td>
  <td style="text-align:center;">
    <table cellspacing="1" cellpadding="3" class="tablehead">
    <tr>
      <td width="50%" style="text-align:right;">SF: -3<br/>STL: +3</td>
      <td style="text-align:left;">-111<br/>+101</td>
    </tr>
    </table>
  </td>
  <td style="text-align:center;">
    <table cellspacing="1" cellpadding="3" class="tablehead">
    <tr>
      <td width="50%">41.5 O/U</td>
      <td width="50%">o: -106<br/>u: -104</td>
    </tr>
    </table>
  </td>
  <td style="text-align:center;">SF: -160<br/>STL: 150</td>
  </tr>

如您所见,有三(3)个</tr>标签 如何调整模式以使用第三个标记而不是第一个标记?

由于

2 个答案:

答案 0 :(得分:0)

只需使用

  

@"\<tr class=((.*?)\</tr>){3}"

答案 1 :(得分:0)

尝试使用此正则表达式:

<tr class=.*?(<tr>.*?</tr>.*?)*</tr>