例如,如果我想从此页面设置索引值: http://ca.finance.yahoo.com/q;_ylt=Agfc5O8HHTlOLgX.q6V4HEtyzJpG;_ylu=X3oDMTFkdnZqMHBkBHBvcwMyBHNlYwN5ZmlNYXJrZXRTdW1tYXJ5RnJvbnRwYWdlBHNsawNzcHRzeA--?s= ^ GSPTSE
变量,我该怎么做?
我对编程很新,如果你解释每一行我真的很感激。 我的观点不是要完成它,我想了解它。
非常感谢你!
答案 0 :(得分:2)
如果查看网页的源代码,您会发现索引编号位于span标记内,该标记具有唯一ID:<span id="yfs_l10_^gsptse">13,702.33</span>
。
这意味着您可以抓取页面,然后挑出单个标记。
您需要先连接主机并下载页面。您执行此操作的方式取决于您使用的语言。有很多教程 - 只需搜索“[语言]网页抓取”。
然后你需要从html源代码创建一个文档对象模型 - 再次,这取决于语言,它在某些方面很容易,在其他方面很难。完成后,只需搜索ID为yfs_l10_^gsptse
的代码并抓取内容。
希望有所帮助 - 显然有很多我没说过,但这取决于你想用什么语言。