从html正文中检索

时间:2014-11-18 03:39:03

标签: asp.net vb.net

从这个邮件的HTML正文中,我如何只检索正文(嗨...谢谢你)到文本框

   <html><body><div style="color:#000; background-color:#fff; font-family:HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, Sans-Serif;font-size:14px"><div>Hi...ThankYou</div></div></body></html>

谢谢

2 个答案:

答案 0 :(得分:1)

我建议您查看HTML解析库,例如HtmlAgilityPackCsQuery

以下是在CsQuery中完成的操作(选择器语法与jquery兼容):

    Dim html = "<html><body><div style=""color:#000; background-color:#fff; font-family:HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, Sans-Serif;font-size:14px""><div>Hi...ThankYou</div></div></body></html>"
    Dim cs = CsQuery.CQ.Create(html)
    Dim txt = cs("body>div>div").Text()

    textBox.Text = txt

您可以使用PM> Install-Package CsQuery -Version 1.3.4命令

通过Nuget获取CsQuery

答案 1 :(得分:1)

您可以使用HtmlAgilityPack

var node = doc.DocumentNode.SelectNodes("/html/body/div/div");