从网站C#获取HTML

时间:2019-06-01 09:19:15

标签: c# html

我需要从此页面https://warcraft3.info/replays/18723解析一些数据

只有WebBrowser可以帮助我获得更多的html部分,但我仍然无法获得所有的html文本。但是WebBrowser控件可以正确显示页面。
使用浏览器保存页面时,我会得到所需的内容。
有人可以帮我一些建议吗?

 var d = (wfhSample.Child as System.Windows.Forms.WebBrowser).Document.Body.OuterHtml;

2 个答案:

答案 0 :(得分:0)

第一个调用端口是阅读以下内容,您可以提取几乎所有具有有效标记的内容。 https://jsoup.org/

答案 1 :(得分:0)

HTML Agility Pack

  

这是一个敏捷的HTML解析器,可构建读/写DOM并支持纯XPATH或XSLT(您实际上不必了解XPATH或XSLT即可使用它,不用担心...)。这是一个.NET代码库,可让您解析“网络外” HTML文件。该解析器对“真实世界”格式的HTML十分宽容。对象模型与提出System.Xml的对象模型非常相似,但是用于HTML文档(或流)。

我亲自将其用于不同的项目。简单易用。