我有一个数字列表。
L1=[12,32,21,......]
我需要对每个成员执行以下测试,容忍最多2次失败 - 不再需要。
注意:该功能是ILLUSTRATIVE(非实际) - 目标是测试每个成员并将失败的成员作为列表返回。
同样出于性能考虑,我们的想法是在故障超过2时立即中止。
def isgreaterthan10(self,x):
if x<10:
return false
else:
return true
所以我做了以下几点。
def evaluateList(L1):
Failedlist=list()
Failures=0
for x in L1:
if not isgreaterthan10(x):
Failedlist.add(x)
Failures+=1
if Failures>2:
return (False,[])
return (True,Failedlist)
但我确信这可以通过更高效的'pythonic'方式完成,因为性能非常优越。 非常感谢任何有助于实现这一目标的帮助 我在Python 2.6.5上
答案 0 :(得分:3)
如果表现很关键,我会使用numpy(或scipy)来对其进行矢量化。
>>> import numpy
>>> L1 = [47, 92, 65, 25, 44, 8, 74, 42, 48, 56, 74, 5, 60, 84, 88, 16, 69, 87, 9, 82, 69, 82, 40, 49, 1, 45, 93, 70, 22, 40, 97, 49, 95, 34, 28, 91, 79, 9, 32, 91, 41, 22, 36, 2, 57, 69, 81, 73, 7, 71]
>>> arr = numpy.array(L1)
>>> count_of_num_greater_than_10 = numpy.sum(arr > 10)
>>> num_greater_than_10 <= 2
False
当然,它不会短路,所以如果你很早就有两个错误的陈述,它会计算其余的。
简单的计时测试,使用随机1000个元素列表进行1000次迭代,填充数字从1到100(在启动计时器之前完成数组创建的设置),显示矢量化方法快100倍。
>>> import timeit
>>> timeit.timeit('sum([n>10 for n in L1])>=2',
setup='import numpy; L1=list(numpy.random.randint(1,100,1000))',
number=1000)
2.539483070373535
>>> timeit.timeit('numpy.sum(L1>10)>=2',
setup='import numpy; L1=numpy.random.randint(1,100,1000)',
number=1000)
0.01939105987548828
如果你想要失败的成员,那就不那么难了;你可以找到不大于10的数字:
>>> list(arr[numpy.where(arr<10)])
[8, 5, 9, 1, 9, 2, 7]
矢量化版本再次比非矢量化版本快几个数量级:
>>> timeit.timeit('[i for i in L1 if i < 10]',
setup='import numpy; L1=list(numpy.random.randint(1,100,1000))',
number=1000)
0.4471170902252197
>>> timeit.timeit('L1[numpy.where(L1<10)]',
setup='import numpy; L1=numpy.random.randint(1,100,1000)',
number=1000)
0.011003971099853516
答案 1 :(得分:2)
最好的方法是通过numpy
(看看@drjimbob的时间),但这是一个纯粹的python解决方案。与创建列表组合的解决方案不同,此解决方案可以懒惰地评估。
from operator import gt
from itertools import ifilter, islice
from functools import partial
def F(seq, N, limit):
it = ifilter(partial(gt, limit), seq)
failed = list(islice(it, N))
return (True, failed) if next(it, None) is None else (False, [])
>>> F([10, 11, 12], 2, 10)
(True, [])
>>> F([1, 2], 2, 10)
(True, [1, 2])
>>> F([1, 2, 3], 2, 10)
(False, [])
但是你可能会发现你的解决方案无论如何都运行得更快(不考虑numpy)
答案 2 :(得分:1)
首先,您可以简化您的第一个功能。我将省略self
所以它很容易测试,但将其修改为类方法是微不足道的:
def isgreaterthan10(x):
return x > 10
现在,我们可以使用列表推导来简化evaluateList
函数:
def evaluateList(li):
x = [v for v in li if not is_greater(v)]
if len(x) > 2:
return (False, [])
return (True, x)
或者,如果你正在使用python 3并且真的想玩代码高尔夫:
def evaluate(li):
x = [v for v in li if not is_greater(v)]
return (True, []) if len(x) > 2 else (False, x)
答案 3 :(得分:1)
有一些提示让它更像Pythonic:
命名时,函数使用下划线,而不是CamelCase,变量以小写字母开头。
您的过滤器函数可以简单地返回x<10
的值,而不是分支并返回布尔常量。我假设self
存在它是类的一部分,但由于它从不使用self
,所以你可以将它定义为静态方法。
@staticmethod
def is_greater_than_10(x):
return x < 10
(如果它不属于某个类,只需从参数列表中删除self
。)
在您的评估函数中,无需返回显式布尔常量来指示成功或失败(但不是因为我最初在评论中发布的原因)。相反,引发异常以指示太多小值。
class TooManySmallValues(Exception):
pass
def evaluate_list(l1):
failed_list = list()
failures=0
for x in l1:
if not is_greater_than_10(x):
failed_list.append(x)
failures+=1
if failures>2:
raise TooManySmallValues()
return failed_list
现在,您可能已经调用了这样的函数:
result, failures = evaluate_list(some_list)
if not result:
# do something about the many small values
else:
# do something about the acceptable list and the small number of failure
你会这样称呼它:
try:
failures = evaluate_list(some_list)
except TooManySmallValues:
# do something about the many small values
最后,除非列表很大并且您实际上会通过提前停止观察到显着的性能提升,请使用列表推导来立即生成所有失败,然后检查有多少失败:
def improved_evaluate_list(l1):
failed_list = [ x for x in l1 if not is_greater_than_10(x) ]
if len(failed_list) > 2:
raise TooManySmallValues()
else:
return failed_list
答案 4 :(得分:0)
此?
>>> def evaluateList(thelist):
... mylist = [i for i in thelist if i < 10]
... return (len(mylist)<=2,mylist if len(mylist)<=2 else [])
>>> L = [4, 36, 34, 12, 43, 9, 16, 19]
>>> evaluateList(L)
(True, [4, 9])
>>> K = [1, 64, 23, 6, 23, 14, 16, 22, 8]
(False, [])
答案 5 :(得分:0)
您可以随时使用filter():
#!/usr/bin/python
def isnotgreaterthan10(x):
return x <= 10
def evaluateList(L1):
l = filter(isnotgreaterthan10, L1)
return False if len(l) > 1 else True
def main():
my_list_bad = [1, 2, 14, 15, 17]
my_list_good = [1, 19, 22, 23]
if evaluateList(my_list_bad):
print("my_list_bad passes.")
else:
print("my_list_bad fails.")
if evaluateList(my_list_good):
print("my_list_good passes.")
else:
print("my_list_good fails.")
if __name__ == "__main__":
main()