如何根据两个列表条件迭代熊猫数据框

时间:2021-05-11 15:24:03

标签: python pandas loops

我创建了两个独特的列表,一个包含所有产品,一个包含所有地理位置。我想要做的是根据两个列表中的值遍历数据框。我想对每个地理区域内的产品进行计算。我将如何设置代码以在产品在特定地理位置销售时进行迭代,它将执行计算然后移动到下一个?我目前拥有的是下面的代码,但它只创建了一个包含一行的数据框。

# pseudo code:

# create unique lists:
DC_list = data4['Geography'].drop_duplicates().tolist()
Product_List = data4['Product'].drop_duplicates().tolist()


# create for loop and zip lists:
for p, g in zip(Product_List, DC_list):
    df_DC_product = (data4.loc[(data4["Geography"]==g) & (data4["Product"]==p)]).copy()
    # perform calculation

1 个答案:

答案 0 :(得分:0)

问题是副本在每次迭代中都会被覆盖,你最好像这样追加:

# pseudo code:

# create unique lists:
DC_list = data4['Geography'].drop_duplicates().tolist()
Product_List = data4['Product'].drop_duplicates().tolist()

df_DC_product=pd.DataFrame(columns=data4.columns)
# create for loop and zip lists:
for p, g in zip(Product_List, DC_list):
    df_DC_product = (data4.loc[(data4["Geography"]==g) & (data4["Product"]==p)]).append(df_DC_product)
    # perform calculation

请注意,我在循环之前初始化了数据帧 df_DC_product,然后用追加替换了副本