我在Python中有一个列表,我作为程序的一部分生成。我有一个强烈的假设,即这些都是不同的,我用断言检查这个。
这就是我现在这样做的方式:
如果有两个要素:
try:
assert(x[0] != x[1])
except:
print debug_info
raise Exception("throw to caller")
如果有三个:
try:
assert(x[0] != x[1])
assert(x[0] != x[2])
assert(x[1] != x[2])
except:
print debug_info
raise Exception("throw to caller")
如果我必须用四个元素来做这件事,我会发疯的。
有没有更好的方法来确保列表中的所有元素都是唯一的?
答案 0 :(得分:26)
也许是这样的:
if len(x) == len(set(x)):
print "all elements are unique"
else:
print "elements are not unique"
答案 1 :(得分:18)
最流行的答案是O(N)(好! - )但是,正如@Paul和@Mark指出的那样,它们要求列表的项目可以清除。 @Paul和@ Mark提出的不可用项目的方法都是通用的,但是采用O(N平方) - 即很多。
如果您的列表的项目不可清,但 可比较,那么您可以做得更好......这里的方法总是尽可能快地根据列表项目的性质进行工作。
import itertools
def allunique(L):
# first try sets -- fastest, if all items are hashable
try:
return len(L) == len(set(L))
except TypeError:
pass
# next, try sort -- second fastest, if items are comparable
try:
L1 = sorted(L)
except TypeError:
pass
else:
return all(len(list(g))==1 for k, g in itertools.groupby(L1))
# fall back to the slowest but most general approach
return all(v not in L[i+1:] for i, L in enumerate(L))
这是O(N)在可行的情况下(所有项目都可以清洗),O(N log N)作为最常见的后备(一些项目不可用,但都是可比较的),O(N平方)不可避免(某些项目不可取,例如dicts,以及一些不可比的,例如复数。)
这段代码的灵感来自于伟大的蒂姆·彼得斯的一个古老的食谱,它实际上产生了一个独特的项目列表(而且到目前为止,set
还没有 - 它必须使用dict
......! - ),但基本上面临同样的问题。
答案 2 :(得分:7)
这个怎么样:
if len(x) != len(set(x)):
raise Exception("throw to caller")
这假设x
中的元素是可以删除的。
答案 3 :(得分:2)
希望序列中的所有项目都是不可变的 - 如果没有,您将无法在序列上调用set
。
>>> set( ([1,2], [3,4]) )
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'
如果你做有可变项,你就不能对这些项进行散列,你几乎不得不反复查看列表:
def isUnique(lst):
for i,v in enumerate(lst):
if v in lst[i+1:]:
return False
return True
>>> isUnique( ([1,2], [3,4]) )
True
>>> isUnique( ([1,2], [3,4], [1,2]) )
False
答案 4 :(得分:1)
在构建列表时,您可以检查该值是否已存在,例如:
if x in y:
raise Exception("Value %s already in y" % x)
else:
y.append(x)
这样做的好处是会报告冲突变量。
答案 5 :(得分:0)
您可以处理列表以创建已知的唯一副本:
def make_unique(seq):
t = type(seq)
seen = set()
return t(c for c in seq if not (c in seen or seen.add(c)))
或者如果seq元素不可清除:
def unique1(seq):
t = type(seq)
seen = []
return t(c for c in seq if not (c in seen or seen.append(c)))
这将使项目保持有序(当然,省略重复)。
答案 6 :(得分:0)
我会用这个:
mylist = [1,2,3,4]
is_unique = all(mylist.count(x) == 1 for x in mylist)