>>> n = [1,2,3,4]
>>> filter(lambda x:x>3,n)
<filter object at 0x0000000002FDBBA8>
>>> len(filter(lambda x:x>3,n))
Traceback (most recent call last):
File "<pyshell#3>", line 1, in <module>
len(filter(lambda x:x>3,n))
TypeError: object of type 'filter' has no len()
我无法得到我得到的列表的长度。所以我尝试将它保存到变量中,就像这样......
>>> l = filter(lambda x:x>3,n)
>>> len(l)
Traceback (most recent call last):
File "<pyshell#5>", line 1, in <module>
len(l)
TypeError: object of type 'filter' has no len()
没有使用循环,有没有办法得到它的长度?
答案 0 :(得分:58)
你必须以某种方式迭代过滤器对象。一种方法是将其转换为列表:
l = list(filter(lambda x: x > 3, n))
len(l) # <--
但是,这可能会破坏使用filter()
的重点,因为你可以通过列表理解更轻松地做到这一点:
l = [x for x in n if x > 3]
同样,len(l)
将返回长度。
答案 1 :(得分:18)
这是一个老问题,但我认为这个问题需要使用 map-reduce 意识形态来回答。 所以这里:
from functools import reduce
def ilen(iterable):
return reduce(lambda sum, element: sum + 1, iterable, 0)
ilen(filter(lambda x: x > 3, n))
如果n
不适合计算机内存,则此功能尤为出色。
答案 2 :(得分:10)
python 3的docs说它返回一个迭代器
“从iterable的那些元素构造一个迭代器 函数返回true。“
在python 2中,它返回了一个列表:见here。 您需要迭代过滤器对象以查找其长度。
答案 3 :(得分:3)
通常,filter
和reduce
不是pythonic。
@arshajii提到了这个解决方案:
len([x for x in n if x > 3])
这很简单,但并没有描述你想要做什么,而是制作一个可能会使用额外内存的列表。
更好的解决方案是将sum
与生成器一起使用:
sum(1 for x in n if x > 3)
(在此处查看有关生成器的更多信息:https://www.python.org/dev/peps/pep-0289/#rationale)
但是,由于实现(在CPython 3.6.4中测试),带有生成器的sum
在大多数情况下实际上更慢:
In [1]: %timeit len([1 for x in range(10000000)])
356 ms ± 17.4 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
In [2]: %timeit sum(1 for x in range(10000000))
676 ms ± 7.05 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
答案 4 :(得分:3)
将过滤器转换为列表将占用额外的内存,这对于大量数据可能不可接受。您可以找到过滤器对象的长度,而无需将其转换为列表:
sum(1 for _ in filter(lambda x: x > 3, n))