对多个数据帧执行操作

时间:2015-04-07 13:57:49

标签: python pandas

我正忙于一个项目,该项目需要对从csv文件读入的大量数据帧执行任务。这需要一次发生一行,一次发生一个数据帧。

所以我的想法是从第一个数据帧中选择第一行并对该数据执行某些操作。然后我转到第二个数据帧的第一行,再次对该数据做同样的事情。一旦我浏览了每个数据帧,我就会回到第一个数据帧并选择第二行数据。我继续这样做,直到我遍历每个数据帧的每一行。

我需要知道在任何时间点使用哪个数据帧。因此,当我从df中选择一行时,我还需要确定它是哪个df。

我的问题是围绕用什么数据结构来实现这一目标。我想知道我是否可以使用词典:

dict_of_dataframes = {'abc' = df1, 'xyz' = df2}

将有超过100个数据帧,每个数据帧可能有数百/数千行。

dict是一个很好的方法来实现这个目标吗?


有关要求的更多说明:

每个数据框都是从包含历史股票数据的csv创建的,即:

Date, Open, High, Low, Close, Volume

每个股票都有一个csv / dataframe。 csv / dataframe的每一行都是一天,可以追溯到几年。

目标是对数据进行回溯测试(NB:这不是为了测试一只股票的策略,而是测试整个股票组合)。要做到这一点,必须没有能力向前看。换句话说,我需要每次为每一只股票做一天,然后再到第二天。

所以我不能自己完成一个数据帧,然后转到下一个。我需要看看整个投资组合如何贯穿始终。

我希望这有助于澄清?

1 个答案:

答案 0 :(得分:0)

看起来您可以将所有文件放在一个数据框中,为库存添加额外字段,按日期和库存对其进行排序并迭代行。我认为这符合你的目的。