python - 分析抓取数据时的最佳方法

时间:2016-08-21 15:03:05

标签: python

新手在这里。我已经设法整理了一个从网站上删除一些信息的脚本。这种情况每天都会发生,数据会保存在csv文件中。每个文件的内容与此类似:

date, ticker, company name, momentum indicator, other ratios....
2016-08-19, GSK, GlaxoSmithKline, 42, ....
2016-08-19, RDSB, Royal Dutch Shell, 98, .....
....

我已经积累了3个月的日常数据,所以大约有80个文件。 (文件中的每一行都具有相同的日期,然后是不同的共享)。 我现在想做的是按股票比例检查动量指标和其他比率的变化。

例如,我认为我最终会得到一系列列表,例如

GSK_momentum_indicator = (42, 43, 38, 47,...) 
RDSB_momentum_indicator = (98, 91, 77, 79,...)

现在,作为一个新手,我有两个问题: 1)您认为最好的方法是什么?它使用列表,词典,还有其他什么? 2)你如何决定上述内容?是否有使用策略的指导方针?是否有一个很好的资源我可以作为新手阅读以了解更多关于这个主题的信息?

谢谢!

PS。如果它有所作为,我使用的是python 3.5.2。

1 个答案:

答案 0 :(得分:1)

为了处理您收集的数据,您可以使用其中一个python模块csvpandascsv模块用于从/向csv文件读取/写入数据,然后您可以将数据转换为python列表和字典并相应地使用。有关详细文档,请转到here

但是如果你有大型数据集,那么你应该去pandas这是一个专门的数据分析工具。 pandas.read_csv函数将csv文件的名称作为参数,并返回一个DataFrame对象,您可以在该对象上执行各种操作。有关详细文档,请转到here