Question

我有一个df（又名meta），其中包含数千个企业的一些详细信息。我还有一个字典（又名数据），其中包含5000+个数据框，每个数据框都有2000+行的交易明细与每个公司相匹配。此字典的键是meta df中的['Symbol']列。

我正在尝试在元df中创建一个新列，该列具有来自数据dfs特定列的汇总值。这是下面的代码，并且可以正常工作，但是要花很长时间，而且我知道将来需要创建更多的列（按照这种特定方式，但是要有不同的合计，等等）。我在问是否有更有效的编码方式？谢谢您的帮助！

count = 0
key_errors = []
for i in range(len(meta)):
    count += 1
    if count % 100 == 0:
        print ('Processed: {}'.format(count))

    index = meta['Symbol'].iloc[i]
    try:
        meta['Avg Daily Returns'].iloc[i] = data[index]['Adj Close'].pct_change(1).mean()
    except KeyError:
        key_errors.append(index)

print ('Processed: {}\nComplete.\nKey errors for: {}'.format(count,key_errors))

熊猫-从单独的DF创建汇总值的新列

0 个答案: