如何从HTML页面中读取特定数字

时间:2011-04-19 01:49:17

标签: c# html

例如,如果我想从此页面设置索引值: http://ca.finance.yahoo.com/q;_ylt=Agfc5O8HHTlOLgX.q6V4HEtyzJpG;_ylu=X3oDMTFkdnZqMHBkBHBvcwMyBHNlYwN5ZmlNYXJrZXRTdW1tYXJ5RnJvbnRwYWdlBHNsawNzcHRzeA--?s= ^ GSPTSE

变量,我该怎么做?

我对编程很新,如果你解释每一行我真的很感激。 我的观点不是要完成它,我想了解它。

非常感谢你!

1 个答案:

答案 0 :(得分:2)

如果查看网页的源代码,您会发现索引编号位于span标记内,该标记具有唯一ID:<span id="yfs_l10_^gsptse">13,702.33</span>

这意味着您可以抓取页面,然后挑出单个标记。

您需要先连接主机并下载页面。您执行此操作的方式取决于您使用的语言。有很多教程 - 只需搜索“[语言]网页抓取”。

然后你需要从html源代码创建一个文档对象模型 - 再次,这取决于语言,它在某些方面很容易,在其他方面很难。完成后,只需搜索ID为yfs_l10_^gsptse的代码并抓取内容。

希望有所帮助 - 显然有很多我没说过,但这取决于你想用什么语言。