将嵌套列表与数据框匹配

时间:2019-03-08 15:53:57

标签: python pandas

我有一个嵌套列表,如下所示,

[['a'], ['b'], [], ['d', 'a'], ['c', 'd', 'a']]

我还有一个数据框,该数据框将字母映射为一个值,即

  col1  value
0    a      2
1    b      5
2    c      4
3    d      9

我的目标是使列表中的字母与数据框匹配,并返回相应的值。如果字母多于1个,则需要它们的值之和。我的预期结果是一个如下所示的平面列表,

[2, 5, 0, 11, 15]

我尝试执行for循环,但无法正常工作。

for i in l1:
    if len(i) == 0:
        print(0)
    elif len(i) > 1:
        for j in i:
            print(d1[d1['col1'] == j]['value'])
    else:
        print(d1[d1['col1'] == i]['value'])

此外,由于数据集巨大,效率在这里很关键

数据

l1 = [['a'], ['b'], [], ['d', 'a'], ['c', 'd', 'a']]
d1 = pd.DataFrame({'col1':['a', 'b', 'c', 'd'], 'value':[2, 5, 4, 9]})

会话详细信息

print(sys.version)
3.6.1 |Anaconda 4.4.0 (64-bit)| (default, May 11 2017, 13:25:24) [MSC v.1900 64 bit (AMD64)]

1 个答案:

答案 0 :(得分:3)

IIUC用于isin的循环

[d1.loc[d1.col1.isin(x),'value'].sum()for x in l1]
Out[883]: [2, 5, 0, 11, 15]