我的500个数据帧看起来像这样,它是一个基于一天的数据,为期两年。
所有数据帧具有相似的列数,但具有不同的行数。所有这些DataFrame都有一些相似的时间戳。我想从我所有的数据帧中获取通用时间戳。
目标是过滤出我所有500个数据帧中的通用时间戳,并创建仅包含通用时间戳的新500个数据帧的子集。
答案 0 :(得分:0)
如果您一次可以将所有500个存储在内存中,那么将它们存储在字典中很有用。然后,您可以找到所有日期的交集,然后保存子集:
import pandas as pd
from functools import reduce
d = dict((file, pd.read_csv(file)) for file in [your_list_of_files])
date_com = reduce(lambda l,r: l & r [set(df.Date) for _,df in d.items()])
for file,df in d.items():
df[df.Date.isin(date_com)].to_csv(f'adjusted_{file}')