我需要从此页面https://warcraft3.info/replays/18723解析一些数据
只有WebBrowser可以帮助我获得更多的html部分,但我仍然无法获得所有的html文本。但是WebBrowser控件可以正确显示页面。
使用浏览器保存页面时,我会得到所需的内容。
有人可以帮我一些建议吗?
var d = (wfhSample.Child as System.Windows.Forms.WebBrowser).Document.Body.OuterHtml;
答案 0 :(得分:0)
第一个调用端口是阅读以下内容,您可以提取几乎所有具有有效标记的内容。 https://jsoup.org/
答案 1 :(得分:0)
这是一个敏捷的HTML解析器,可构建读/写DOM并支持纯XPATH或XSLT(您实际上不必了解XPATH或XSLT即可使用它,不用担心...)。这是一个.NET代码库,可让您解析“网络外” HTML文件。该解析器对“真实世界”格式的HTML十分宽容。对象模型与提出System.Xml的对象模型非常相似,但是用于HTML文档(或流)。
我亲自将其用于不同的项目。简单易用。