如何在Python中对Pandas DataFrame进行循环矢量化?

时间:2019-01-07 07:52:39

标签: python pandas dataframe vectorization

我需要通过矢量化使此代码快速运行

final1 = pd.DataFrame()
for index, row in demo1.iterrows():
    a = np.random.choice([0, 1], size=1000, p=[1 - row['prob'], row['prob']])
    b = a * row['syb'] * (1 + row['percentage_change_syb'] / 100)
    final1 = final1.append(pd.DataFrame(b).T)

1 个答案:

答案 0 :(得分:1)

由于您没有提供要使用的数据,因此以下代码未选中,但应该可以使用:

def computation(prob, syb, percentage_change_syb):
    a = np.random.choice([0, 1], size=1000, p=[1 - prob, prob])
    b = a * syb * (1 + percentage_change_syb / 100)
    return b.T

final1 = computation(demo1['prob'].values, demo1['syb'].values, demo1['percentage_change_syb'].values)

有关选择对NumPy数组进行操作的更多信息,我建议使用this article