我正在创建一个网站,用于获取从黄金到欧元的实时汇率。这是我要使用的网站:http://www.24hgold.com/english/gold_silver_prices_charts.aspx?money=Euro
目前,我打算查看网站的来源并搜索此部分:<span id="lbGoldGramEurValue" class="number" style="font-weight:bold;">
然后我可以获得欧元的克数。这种技术叫做什么?然后我可以在.NET中找到其他样本。
这是唯一可行的方法还是其他更先进和更简单的方法?
答案 0 :(得分:1)
您必须解析从该URL获取的HTML,以便可以访问该元素。
该技术称为HTML解析。但是,每当该网站的HTML结构发生变化时,您的解决方案可能会出现问题,因为您必须更新代码。
你找不到可以为你提供这些数据的API吗?
答案 1 :(得分:1)
这称为“网络抓取”,通常是一个坏主意。我说这个的主要原因是你的应用程序对第三方网站的标记变化很脆弱。他们需要做的就是a)更改id
,b)更改class
或c)更改该元素的style
,然后您的应用就会变成kaput。
更好的方法(尽管可能不是免费的)是搜索提供所需信息的公共网络服务。快速搜索出现了:
我还应该注意,网页抓取另一个网站可能会侵犯他们的版权。