如何提取&显示网页的数据信息

时间:2014-03-28 00:03:32

标签: c# html web-scraping

我有一个问题&我需要一些帮助 我想创建一个程序[C#]来从网站提取数据信息&显示我的程序的信息 我对这种方法并不好我需要一个例子(学习它) 所以例如我有这个网站:www.whatismyip.com 我想从网页上提取国家信息(国家:美国):

<div class="country">Country:</div> <div class="the-country">USA

&安培;在我的程序[C#]中显示它(国家:美国) 我非常需要帮助来解决这个问题,如果有人知道某种方法或任何想法,请

1 个答案:

答案 0 :(得分:0)

我做了类似的事情,但它是用于检查当前的Minecraft版本。我用了Html Agility Pack。它允许您读入代码并对您需要的任何信息进行排序。这是我用过的代码。

        Regex Regex = new Regex("[^0-9.]");
        HtmlWeb client = new HtmlWeb();
        //Check Server version
        try
        {
            HtmlAgilityPack.HtmlDocument doc = client.Load("https://minecraft.net/download");
            HtmlNodeCollection Nodes = doc.DocumentNode.SelectNodes("//p//a[@href]");

            ServerVersion = Regex.Replace(Nodes[4].InnerText, String.Empty).Remove(0, 1).TrimEnd('.');
            BStripServerVersion.Text = ServerVersion + "  |";
            FileName = (Nodes[6].InnerText);
        }
        catch (Exception ex)
        {
            MessageBox.Show(ex.ToString());
        }

您可能需要修复某些区域并搜索div类。 我的代码读入网页中的所有段落/ ahref语句,然后将其存储在数组中。之后 - 我必须手动完成,直到找到我想要的那个。我相信这也适合你。我的代码可能/可能效率不高但它会给你一个想法。

您也可以使用WebClient课程。