Question

从Python中的大列表中剔除项目的最有效方式（就内存和cpu而言）是什么？这是一个好方法吗？

a = range(0,100000)
a[:] = [item for item in a if item > 10]

这里的数字只是一个例子。也可能是：

a = ["my", "very", "big", "list"]
a[:] = [item for item in a if item.startswith("b")]

Answer 1

如果你真的想要一个列表（并且你想要替换原来的列表），那么你可能不会比纯python更好。但是，这通常不是必需的。通常，您只需要一个可迭代的对象：

generator = (item for item in a if item > 10)
for item in generator:
    ...

这将提高内存效率，性能应大致相同。

Answer 2

Python具有专门为此目的而构建的生成器函数。请参阅文档here。除了使用range（文档建议使用返回生成器的xrange）之外，您的实现完全没问题。

文档有以下示例：

# Build and return a list
def firstn(n):
    num, nums = 0, []
    while num < n:
        nums.append(num)
        num += 1
    return nums

sum_of_first_n = sum(firstn(1000000))

浪费了很多空间。所以文档建议做这样的事情：

# Using the generator pattern (an iterable)
class firstn(object):
    def __init__(self, n):
        self.n = n
        self.num, self.nums = 0, []

    def __iter__(self):
        return self

    def next(self):
        if self.num < self.n:
            cur, self.num = self.num, self.num+1
            return cur
        else:
            raise StopIteration()

sum_of_first_n = sum(firstn(1000000))

Answer 3

您可以在此使用filter或generators

<强>发电机

>>> data = [10, 20, 4, 4, 11, 13.4]
>>> custom_filter = (i for i in data if i > 10)
>>> [j for j in custom_filter]
[20, 11, 13.4]
>>>

过滤

>>> data = [10, 20, 4, 4, 11, 13.4] >>> custom_filter = filter(lambda x: x > 10, data) >>> custom_filter [20, 11, 13.4] >>>

高效的清单剔除

3 个答案: