使用熊猫迭代列表VS

时间:2020-05-19 18:06:46

标签: python pandas

我有一个很大的列表,称为重组,其组织方式如下:

['HYDR', 30472.0, 'B'], ['HYDR', 30470.0, 'S'], ['HYDR', 30474.0, 'B'].....

我的一段代码:

sum_buys = 0
sum_sells = 0
for deal in reassembly:
    ticker, vol, oper = deal[0], deal[1], deal[2]
    if oper == "B":
        sum_buys = sum_buys + vol
    elif oper == "S":
        sum_sells = sum_sells + vol

列表非常大。从开始到结束大约需要5分钟。很长的时间。

熊猫图书馆可以帮助我更快地做到吗?我从不使用它。

我该怎么办?

  1. 将称为重组的列表转换为熊猫数据框

  2. 使用熊猫方法计算两个参数:sum_buys和sum_sells

请帮助我!

1 个答案:

答案 0 :(得分:5)

是的,您可以并且应该将列表转换为熊猫数据框并使用groupby()

df = pd.DataFrame(reassembly, columns=['tickers','vol','operation'])

df.groupby('operation')['vol'].sum()

示例数据的输出:

operation
B    60946.0
S    30470.0
Name: vol, dtype: float64

也可以说,也许您对每个股票的总买入/卖出感兴趣,您可以这样做:

df.groupby(['tickers','operation'])['vol'].sum()

得到这样的东西:

tickers  operation
HYDR     B            60946.0
         S            30470.0
Name: vol, dtype: float64

要忽略与vol<100000的交易,我们可以保留与vol >= 100000的所有交易,

df = df[df['vol']>=100000]