Python - 切片数组,直到满足某些条件

时间:2011-03-07 05:42:11

标签: python arrays numpy slice

我需要从给定索引中切割数组,直到满足某个条件。

>>> a = numpy.zeros((10), dtype='|S1')
>>> a[2] = 'A'
>>> a[4] = 'X'
>>> a[8] = 'B'
>>> a
array(['', '', 'A', '', 'X', '', '', '', 'B', ''], dtype='|S1')

例如,对于上面的数组,我想要一个给定索引的子集,直到两个方向上的第一个非零值。例如,对于索引值2,4,8,结果将是:

['', '', A, '']      # 2
['', X, '', '', '']  # 4
['', '', '', B, '']  # 8

有关使用numpy API执行此操作的最简单方法的任何建议吗?学习python和numpy,会感激任何帮助。谢谢!

5 个答案:

答案 0 :(得分:7)

如果你设置了这样的问题:

import numpy
a = numpy.zeros((10), dtype=str)
a[2] = 'A'
a[4] = 'X'
a[8] = 'B'

您可以轻松获取非空字符串的索引,如下所示:

i = numpy.where(a!='')[0]  # array([2, 4, 8])

或者,numpy.argwhere(..)也适用。

然后你可以使用这个数组切片:

out2 = a[:i[1]]        # 2   ['' '' 'A' '']
out4 = a[i[0]+1:i[2]]  # 4   ['' 'X' '' '' '']

答案 1 :(得分:6)

这是蒙面数组的工作,numpy.ma有许多用于处理子集的函数。

a = np.zeros((10), dtype=str)
a[2] = 'A'
a[4] = 'X'
a[8] = 'B'

让我们掩盖不是空元素:

am=np.ma.masked_where(a!='', a)

np.ma.notmasked_contiguous遍历数组(非常有效)并找到数组未被屏蔽的所有连续元素片段:

slices = np.ma.notmasked_contiguous(am)
[slice(0, 1, None), slice(3, 3, None), slice(5, 7, None), slice(9, 9, None)]

因此,例如,数组在元素5和7之间连续为空。 现在你只需加入你感兴趣的切片,首先得到每个切片的起始索引:

slices_start = np.array([s.start for s in slices])

然后你得到你正在寻找的索引的位置:

slices_start.searchsorted(4) #4
Out: 2

所以你想要切片1和2:     一个[切片[1]。开始:切片[2] .stop + 1]     数组(['','X','','',''],       D型= '| S1')

或者让我们试试8:

i = slices_start.searchsorted(8)
a[slices[i-1].start:slices[i].stop+1]
Out: array(['', '', '', 'B', ''], 
  dtype='|S1')

如果应该在ipython中使用它可以更好地理解它。

答案 2 :(得分:2)

请注意,这可以使用itertools和functools在纯python中干净地完成。

import functools, itertools
arr = ['', '', 'A', '', 'X', '', '', '', 'B', '']

f = functools.partial(itertools.takewhile, lambda x: not x)
def g(a, i):
    return itertools.chain(f(reversed(a[:i])), [a[i]], f(a[i+1:]))

我们将f定义为通过查找直到元素求值为true而找到的子迭代器,并将g作为在索引之前的列表的反转区域和索引之后的列表上应用它的组合。

这将返回可以转换为包含结果的列表的生成器。

>>> list(g(arr, 2))
['', '', 'A', '']
>>> list(g(arr, 4))
['', 'X', '', '', '']
>>> list(g(arr, 8))
['', '', '', 'B', '']

答案 3 :(得分:0)

首先想到的是两个循环。像这样的东西会起作用:

'''Given an array and an index...'''
def getNoneSlice(a, i):

    # get the first non-None index before i
    start = 0
    for j in xrange(i - 1, -1, -1):
        if a[j] is not None: # or whatever condition
            start = j + 1
            break

    # get the first non-None index after i
    end = len(a) - 1
    for j in xrange(i + 1, len(a)):
        if a[j] is not None: # or whatever condition
            end = j - 1
            break

    # return the slice
    return a[start:end + 1]

答案 4 :(得分:-2)

def getSlice(a, n):
    try:
        startindex = a[:n].nonzero()[0][-1]
    except IndexError:
        startindex = 0
    try:
        endindex = a[(n+1):].nonzero()[0][0] + n+1
    except IndexError:
        endindex = len(a)
    return a[startindex: endindex]