我正在尝试使用我通过vb.net代码标记的字符串,并将其与最初来自的文本文件进行交叉检查。这是为了校对html输出。
为此,我需要解析一个不是来自URL的HTML片段。
HTMLAgilityPack的例子我见过从URL获取输入。有没有办法解析一串标记文本,不包括标题或格式良好的网页的类似部分?
由于
答案 0 :(得分:2)
要解析包含HTML代码段而不是文件或URL的字符串,可以使用HtmlDocument作为@Oded建议,但不要使用doc.Load(),而是使用doc.LoadHtml()。
String HtmlSnippet = "<p>Example <strong>Html</strong> snippet</p>";
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(HtmlSnippet);
答案 1 :(得分:0)
而不是WebDocument
使用HtmlDocument
:
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
这是HAP examples page上的第一件事。