Question

我需要从此页面https://warcraft3.info/replays/18723解析一些数据

只有WebBrowser可以帮助我获得更多的html部分，但我仍然无法获得所有的html文本。但是WebBrowser控件可以正确显示页面。
使用浏览器保存页面时，我会得到所需的内容。
有人可以帮我一些建议吗？

 var d = (wfhSample.Child as System.Windows.Forms.WebBrowser).Document.Body.OuterHtml;

Answer 1

第一个调用端口是阅读以下内容，您可以提取几乎所有具有有效标记的内容。 https://jsoup.org/

Answer 2

HTML Agility Pack

这是一个敏捷的HTML解析器，可构建读/写DOM并支持纯XPATH或XSLT（您实际上不必了解XPATH或XSLT即可使用它，不用担心...）。这是一个.NET代码库，可让您解析“网络外” HTML文件。该解析器对“真实世界”格式的HTML十分宽容。对象模型与提出System.Xml的对象模型非常相似，但是用于HTML文档（或流）。

我亲自将其用于不同的项目。简单易用。

从网站C＃获取HTML

2 个答案: