如何在Windows应用商店应用中解析HTML?

时间:2013-11-21 06:27:23

标签: c# windows-store-apps

我已经下载了网页的源代码,我想将HTML文本解析并转换为 HtmlDocument 对象或接口,以便我可以访问其中的HTML元素。

我在网上做了一些搜索。除了使用 HtmlAgilityPack 库之外,唯一可行的方法是创建 WebView 并调用其 NavigateToString ()方法。我不想使用第三方库,所以我尝试了第二种解决方案。我已经调用了该方法,但我不知道在哪里检索文档或类似的内容。

所以我的问题是:如何从WebView检索HtmlDocument?或者有更好的解决方案吗?

1 个答案:

答案 0 :(得分:4)

正如Todd Bowles在上述评论中指出的那样,如果存在第三方解决方案,使用它通常可以节省宝贵的时间和精力。

HTML Agility Pack的替代方案虽然仍处于相当早期阶段,但却是AngleSharp。它可以解析各种基于括号的超文本,特别是HTML和CSS,并且它生成解析的超文本的HTML5 DOM表示。目前,HTML5解析器声称完成了95%,但希望这对常规使用的影响有限。

AngleSharp 是作为可移植类库(PCL)实现的,如果我是正确的,它的目标是 Windows应用商店。 NET Framework 4 及更高版本, Windows Phone 7 及更高版本,以及 Silverlight 4 及更高版本。