如何从Html标签中获取值?

时间:2010-02-12 17:59:51

标签: c# asp.net html

我想从网页中的html标签中获取一些数据。例如,我有一个网站,其中有“www.example.com/test.html”,这是我要拆分的文本。我想要第一个URL,首先在第一个span标签和最后一个span标签之间的文本之间发短信。

如何使用C#ASP.NET 2.0(而不是3.5)?

<a class="tablolinkmetin" target="_blank" href="http://www.iwantthisurl.com/test/2010/subat/12022010_adli_krrnme.htm">
  <img alt=icon src="images/icon/ok.gif" border=0 width="7" height="8">
  <span class=tablolink>
    <span class="genelgeler_mbaslik">I want this text.</span>
  </span>
  <span class="tablolinkaltyazi"><br>and i want here</span> 
</a>
<img src="images/icon/cizgi.png" width="260" height="1"><br>

2 个答案:

答案 0 :(得分:4)

你需要看看:


这是codePlex.com的样本

 HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
 {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
 }
 doc.Save("file.htm");

希望这有帮助

答案 1 :(得分:0)

如果你给控件一个id并将它们设置为runat =“server”,你应该能够直接在你的代码中引用它们。

所以你的页面应该是这样的:

<a id="myanchor" runat="server" class="tablolinkmetin" target="_blank" href="http://www.iwantthisurl.com/test/2010/subat/12022010_adli_krrnme.htm"> 
  <img alt=icon src="images/icon/ok.gif" border=0 width="7" height="8"> 
  <span class=tablolink> 
    <span id="firstSpan" runat="server" class="genelgeler_mbaslik">I want this text.</span> 
  </span> 
  <span id="secondSpan" runat="server" class="tablolinkaltyazi"><br>and i want here</span>  
</a> 
<img src="images/icon/cizgi.png" width="260" height="1"><br>