我想从网页中的html标签中获取一些数据。例如,我有一个网站,其中有“www.example.com/test.html”,这是我要拆分的文本。我想要第一个URL,首先在第一个span标签和最后一个span标签之间的文本之间发短信。
如何使用C#ASP.NET 2.0(而不是3.5)?
<a class="tablolinkmetin" target="_blank" href="http://www.iwantthisurl.com/test/2010/subat/12022010_adli_krrnme.htm">
<img alt=icon src="images/icon/ok.gif" border=0 width="7" height="8">
<span class=tablolink>
<span class="genelgeler_mbaslik">I want this text.</span>
</span>
<span class="tablolinkaltyazi"><br>and i want here</span>
</a>
<img src="images/icon/cizgi.png" width="260" height="1"><br>
答案 0 :(得分:4)
你需要看看:
这是codePlex.com的样本
HtmlDocument doc = new HtmlDocument(); doc.Load("file.htm"); foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"]) { HtmlAttribute att = link["href"]; att.Value = FixLink(att); } doc.Save("file.htm");
希望这有帮助
答案 1 :(得分:0)
如果你给控件一个id并将它们设置为runat =“server”,你应该能够直接在你的代码中引用它们。
所以你的页面应该是这样的:
<a id="myanchor" runat="server" class="tablolinkmetin" target="_blank" href="http://www.iwantthisurl.com/test/2010/subat/12022010_adli_krrnme.htm">
<img alt=icon src="images/icon/ok.gif" border=0 width="7" height="8">
<span class=tablolink>
<span id="firstSpan" runat="server" class="genelgeler_mbaslik">I want this text.</span>
</span>
<span id="secondSpan" runat="server" class="tablolinkaltyazi"><br>and i want here</span>
</a>
<img src="images/icon/cizgi.png" width="260" height="1"><br>