问题
我对网页抓取和数据分析很感兴趣,我想通过使用Python 2.7编写一个监控股票价格变化的程序来发展我的技能。我的目标是能够在一天中的某些点比较两个股票(暂时),将这些信息保存为熊猫可以轻松处理的文档格式(我将在获得此前端工作后学习如何使用) 。最后,我想映射所选股票之间的关系趋势(当这个股票上升x时,对另一股股票的影响是什么)。这只是一个爱好项目,所以代码是否符合生产质量并不重要。
我的经历
我是一个全新的Python程序员(我对python有一个非常基本的了解,没有任何非包含模块的实际经验)但我确实有技术背景,所以如果我的问题的答案需要阅读和理解文档意图对于应该没问题的中级程序员来说。
基础知识我正在学习Python:Mark Lutz强大的面向对象编程,如果这有帮助的话。
我在寻找什么
我知道这是一个非常广泛的主题,我不是要求任何人写任何实际的代码示例或任何东西。我只是想知道去哪里获取更符合我的兴趣和目标的信息。
这实际上是我在这个论坛上发表的第一篇文章,所以请原谅我,如果这不符合发布的最佳做法。在写这篇文章之前,我确实搜索过像我这样的其他问题,并阅读了帖子提示文档。
答案 0 :(得分:0)
那么,你想要网络抓?如果您使用的是Python 2.7,那么您需要查看urllib2
,requests
和BeautifulSoup
库。如果您使用的是Python 3.x,那么您将再次查看urllib
,urllib.request
和BeautifulSoup
。总之,这些库应该完成您在网络抓取方面所要做的一切。
如果您对抓取库存数据感兴趣,我可以建议yahoo_finance
包吗?这是Yahoo Finance API的Python包装器。每当我在过去使用库存数据时,这个模块都非常宝贵。还有googlefinance
。使用这些已经开发的包装器来提取库存信息要容易得多,而不是抓取数百个(如果不是数千个)网页来获取您想要的数据。