使用numpy从摘要(频率)表生成逻辑(二进制)长数据表

时间:2015-01-30 11:58:10

标签: python numpy

在我最近的一篇posts中,我得到了一个很好的答案,我如何使用numpy.repeat功能来生成所谓的长数据格式。现在,我想知道是否有办法制作一个逻辑数据帧(或矩阵),使后来的统计数据更容易。

这就是我在"简单"蟒蛇。但是我非常想学习如何使用numpy来有效地完成它!

import operator
from itertools import chain

t=((('a','b','c'),('w','x'), 2),
   (('d','e','f'),('y','z'), 3), 
   (('g','a','d'),('w','z'), 5))

columns=list(set(reduce(operator.add,(x[0]+x[1] for x in t))))

rows=[]

for i, j, n in t:
    row=[1 if e in i+j else 0 for e in columns]
    for i in range(n): rows.append(row)

rows

我想知道这是否是最有效的方式?我正在学习numpy,我真的很惊讶它有多棒! : - )

谢谢! PM

0 个答案:

没有答案