Question

我试图下载整个HTML页面，如下所示：

var html = new WebClient().DownloadString("http://mypage.com/");

这个HTML文档包含这样的类：

<span class="mem_loc">United States</span>

就像字面意思一样......

我现在需要以某种方式找到这个类mem_loc及其值，即美国或任何其他国家......

有没有＆＃34;容易＆＃34;这可以在C＃中完成吗？

P.S。标签的结构总是这样，所以我可以通过字符串或某种方式搜索它？

P.S。我想只获取＆gt;之间的最新信息＆LT;值，这是一个国家名称......

Answer 1

实现此目的的一种方法是使用HTML解析器。例如，HTML agility pack就是这样一种工具。它允许你这样做：

var result = doc.DocumentNode.SelectNodes("//span[@class='mem_loc']"));