从数组中提取重复值和位置的列表

时间:2013-08-20 15:35:23

标签: python algorithm sorting duplicates

给定长度为a的数组N,这是一个整数列表,我想提取重复值,其中每个值都有一个单独的列表,其中包含重复项的位置。在伪数学中:

If |M| > 1:
  val -> M = { i | a[i] == val }

示例(N=11):

a = [0, 3, 1, 6, 8, 1, 3, 3, 2, 10, 10]

应该提供以下列表:

3  -> [1, 6, 7]
1  -> [2, 5]
10 -> [9, 10]

我添加了python标签,因为我目前正在使用该语言进行编程(numpy和scipy可用),但我更倾向于使用通用算法来完成它。但是代码示例很好。

我还没有充实的一个想法:构建一个元组列表,将a的每个条目与其索引配对:(i, a[i])。使用第二个条目作为键对列表进行排序,然后检查第二个条目相同的连续条目。

3 个答案:

答案 0 :(得分:4)

这是使用python字典的实现(为方便起见,实际上是defaultdict)

a = [0, 3, 1, 6, 8, 1, 3, 3, 2, 10, 10]
from collections import defaultdict
d = defaultdict(list)

for k, item in enumerate(a):
    d[item].append(k)
finalD = {key : value for key, value in d.items() if len(value) > 1}  # Filter dict for items that only occurred once.

print(finalD)    
# {1: [2, 5], 10: [9, 10], 3: [1, 6, 7]}

答案 1 :(得分:3)

我们的想法是创建一个字典,将值映射到它出现的位置列表。

这可以通过setdefault以简单的方式完成。这也可以使用defaultdict完成。

>>> a = [0, 3, 1, 6, 8, 1, 3, 3, 2, 10, 10]
>>> dup={}
>>> for i,x in enumerate(a):
...     dup.setdefault(x,[]).append(i)
...
>>> dup
{0: [0], 1: [2, 5], 2: [8], 3: [1, 6, 7], 6: [3], 8: [4], 10: [9, 10]}

然后,可以使用set comprehension提取实际重复项,以过滤掉仅出现一次的元素。

>>> {i:x for i,x in dup.iteritems() if len(x)>1}
{1: [2, 5], 10: [9, 10], 3: [1, 6, 7]}

答案 2 :(得分:1)

填充一个字典,其字符是整数的值,其值是这些键的位置列表。然后浏览该字典并删除只有一个位置的所有键/值对。你将留下重复的那些。