我试图下载整个HTML页面,如下所示:
var html = new WebClient().DownloadString("http://mypage.com/");
这个HTML文档包含这样的类:
<span class="mem_loc">United States</span>
就像字面意思一样......
我现在需要以某种方式找到这个类mem_loc及其值,即美国或任何其他国家......
有没有&#34;容易&#34;这可以在C#中完成吗?
P.S。标签的结构总是这样,所以我可以通过字符串或某种方式搜索它?
P.S。我想只获取&gt;之间的最新信息&LT;值,这是一个国家名称......
答案 0 :(得分:3)
实现此目的的一种方法是使用HTML解析器。例如,HTML agility pack
就是这样一种工具。它允许你这样做:
var result = doc.DocumentNode.SelectNodes("//span[@class='mem_loc']"));