Pandas Dataframe - 在列中的列表中查找总和

时间:2015-11-04 18:51:07

标签: python pandas

我有一个像

这样的清单
source = [{'TGA': [0, 1, 0, 0], 'AAC': [0, 0, 0, 1], 'GAA': [0, 0, 1, 0], 
           'GTG': [1, 0, 0, 0]},{'TGA': [0, 1, 0, 0], 'AAC': [0, 0, 0, 1], 
           'GAA': [0, 0, 1, 0], 'GTG': [1, 0, 0, 0]} ]

我需要对列表列中的每个数字求和:

pandas.DataFrame(source)
        AAC           GAA           GTG           TGA
  0  [0, 0, 0, 1]  [0, 0, 1, 0]  [1, 0, 0, 0]  [0, 1, 0, 0]
  1  [0, 0, 0, 1]  [0, 0, 1, 0]  [1, 0, 0, 0]  [0, 1, 0, 0]`

最后:

         AAC           GAA           GTG           TGA
    sum  [0, 0, 0, 2 ] [0, 0, 2, 0] [2, 0, 0, 0]  [0, 2, 0, 0]

我该怎么做?

2 个答案:

答案 0 :(得分:0)

您可以使用它来汇总列表的字典列表:

source = [{'TGA': [0, 1, 0, 0], 'AAC': [0, 0, 0, 1], 'GAA': [0, 0, 1, 0],
           'GTG': [1, 0, 0, 0]},{'TGA': [0, 1, 0, 0], 'AAC': [0, 0, 0, 1],
           'GAA': [0, 0, 1, 0], 'GTG': [1, 0, 0, 0]} ]

res = {}
for d in source:
    for key,value in d.items():
            if key not in res:
                    res[key] = value
            else:
                    res[key] = [x+y for x,y in zip(res[key],value) ]

print res

答案 1 :(得分:0)

您可以轻松地将条目更改为numpy.array s,然后加上:

import numpy as np

>> df.applymap(np.array).sum()
AAC    [0, 0, 0, 2]
GAA    [0, 0, 2, 0]
GTG    [2, 0, 0, 0]
TGA    [0, 2, 0, 0]