我有一个df(又名meta),其中包含数千个企业的一些详细信息。 我还有一个字典(又名数据),其中包含5000+个数据框,每个数据框都有2000+行的交易明细与每个公司相匹配。此字典的键是meta df中的['Symbol']列。
我正在尝试在元df中创建一个新列,该列具有来自数据dfs特定列的汇总值。这是下面的代码,并且可以正常工作,但是要花很长时间,而且我知道将来需要创建更多的列(按照这种特定方式,但是要有不同的合计,等等)。我在问是否有更有效的编码方式?谢谢您的帮助!
count = 0
key_errors = []
for i in range(len(meta)):
count += 1
if count % 100 == 0:
print ('Processed: {}'.format(count))
index = meta['Symbol'].iloc[i]
try:
meta['Avg Daily Returns'].iloc[i] = data[index]['Adj Close'].pct_change(1).mean()
except KeyError:
key_errors.append(index)
print ('Processed: {}\nComplete.\nKey errors for: {}'.format(count,key_errors))