如何做累积"所有"

时间:2017-06-14 21:49:41

标签: python pandas numpy

设置
考虑numpy数组a

>>> np.random.seed([3,1415])
>>> a = np.random.choice([True, False], (4, 8))

>>> a
array([[ True, False,  True, False,  True,  True, False,  True],
       [False, False, False, False,  True, False, False,  True],
       [False,  True,  True,  True,  True,  True,  True,  True],
       [ True,  True,  True, False,  True, False, False, False]], dtype=bool)

问题
对于每一列,我想确定所有列的累积等价物。

结果应如下所示:

array([[ True, False,  True, False,  True,  True, False,  True],
       [False, False, False, False,  True, False, False,  True],
       [False, False, False, False,  True, False, False,  True],
       [False, False, False, False,  True, False, False, False]], dtype=bool)

拿第一栏

a[: 0]

# Original First Column
array([ True, False, False,  True], dtype=bool)
# So far so good
#        \     False from here on
#         |    /---------------\
array([ True, False, False, False], dtype=bool)
# Cumulative all

所以基本上,只要我们有True并且从那时开始True False

,累计全部为False

我尝试了什么
我可以用

得到结果
a.cumprod(0).astype(bool)

但是,当我知道从我看到的第一个False开始False时,我不知道是否有必要执行每次乘法运算。

考虑更大的1-D阵列

b = np.array(list('111111111110010101010101010101010101010011001010101010101')).astype(int).astype(bool)

我认为这两个产生相同的答案

bool(b.prod())

b.all()

但是b.all()可以短路而b.prod()没有。如果我给他们计时:

%timeit bool(b.prod())
%timeit b.all()

100000 loops, best of 3: 2.05 µs per loop
1000000 loops, best of 3: 1.45 µs per loop

b.all()更快。这意味着必须有一种方法可以比我的a.cumprod(0).astype(bool)

更快地进行累积

1 个答案:

答案 0 :(得分:13)

All ufuncs have 5 methods<entityFramework> <defaultConnectionFactory type="System.Data.Entity.Infrastructure.LocalDbConnectionFactory, EntityFramework"> <parameters> <parameter value="mssqllocaldb" /> </parameters> </defaultConnectionFactory> <providers> <provider invariantName="System.Data.SqlClient" type="System.Data.Entity.SqlServer.SqlProviderServices, EntityFramework.SqlServer" /> <provider invariantName="System.Data.SQLite.EF6" type="System.Data.SQLite.EF6.SQLiteProviderServices, System.Data.SQLite.EF6" /> <provider invariantName="System.Data.SQLite" type="System.Data.SQLite.EF6.SQLiteProviderServices, System.Data.SQLite.EF6" /> </providers> </entityFramework> <system.data> <DbProviderFactories> <remove invariant="System.Data.SQLite.EF6" /> <add name="SQLite Data Provider (Entity Framework 6)" invariant="System.Data.SQLite.EF6" description=".NET Framework Data Provider for SQLite (Entity Framework 6)" type="System.Data.SQLite.EF6.SQLiteProviderFactory, System.Data.SQLite.EF6" /> </DbProviderFactories> </system.data> <connectionStrings> <add name="connection" connectionString="Data Source=.\GestDB" providerName="System.Data.SqlLite"/> </connectionStrings>reduceaccumulatereduceatouter。在这种情况下,请使用at,因为它返回ufunc的累积应用程序的结果:

accumulate
In [41]: np.logical_and.accumulate(a, axis=0)
Out[50]: 
array([[ True, False,  True, False,  True,  True, False,  True],
       [False, False, False, False,  True, False, False,  True],
       [False, False, False, False,  True, False, False,  True],
       [False, False, False, False,  True, False, False, False]], dtype=bool)