如何使用正则表达式获取内部html内容

时间:2012-07-17 10:27:48

标签: c# html regex

<div class="colmask">
  <h1 class="continent_header"><a name="US"></a>US</h1>
    <div class="colmid">
        <div class="colin">
          <div class="colleft">
          .......
          ....... 
          </div>
         </div>
    </div>
   </h1>
 </div>

如何使用正则表达式获取标签的内部html? 这意味着结果将是

  <h1 class="continent_header"><a name="US"></a>US</h1>
    <div class="colmid">
        <div class="colin">
          <div class="colleft">
          .......
          ....... 
          </div>
         </div>
    </div>
   </h1>

1 个答案:

答案 0 :(得分:1)

请不要使用regular expressions to parse HTML,而是使用HTML Agility Pack

您可以通过以下方式实现目标:

string elementText = doc.GetElementbyId("ELEMENTID").InnerHtml;