如何使用C#从网站中提取确切信息?

时间:2017-04-03 22:05:42

标签: c# web-scraping web-crawler

我从未做过网页抓取或网页抓取。但现在我需要从forex url读取和下载特定数据并存储到数据库中,以便通过开发用C#开发的自动化机器人进行进一步的数据评估。 我正在使用以下代码阅读网站:

public static string GetPage(string url)
    {
        try
        {
            HttpWebRequest wr = (HttpWebRequest)WebRequest.Create(url);

            HttpWebResponse resp = (HttpWebResponse)wr.GetResponse();

            Stream s = resp.GetResponseStream();
            StreamReader tr = new StreamReader(s, Encoding.ASCII);
            string html = tr.ReadToEnd();
            tr.Close();
            s.Close();


            return html;
        }
        catch (Exception ex)
        {
            throw new ApplicationException("Error downloading web page " + url.ToString(), ex);
        }
    }

但是上面的代码给了我页面的完整HTML代码,因为我需要获得EURO到GBP,USD和CHF的转换率读数,但没有别的。 有关详细信息,请参阅下图:

Screenshot

现在请告诉我如何阅读这些具体数据?有没有正确的方法,或者我需要从HTML提取中找到它?感谢。

2 个答案:

答案 0 :(得分:0)

您可以使用HtmlAgilityPack解析html文档,只需从nuget下载即可。 Here是一个关于如何实现它的好教程。

答案 1 :(得分:0)

使用Selenium(提供C#API),您可以读取这些值。查看API,您将找到合适的功能。