两个列表之间的重复/共同元素

时间:2016-09-21 10:32:09

标签: python list python-2.7 for-loop

对于熟悉Python列表的人来说,我有一个愚蠢的问题。 我想在两个列表中获取常见项目。假设我有这个清单:

dates_list = ['2016-07-08 02:00:02', 
              '2016-07-08 02:00:17', 
              '2016-07-08 02:00:03', 
              '2016-07-08 02:00:20', 
              '2016-07-08 02:01:08', 
              '2016-07-08 02:00:09', 
              '2016-07-08 02:01:22', 
              '2016-07-08 02:01:33']

一个名为' time_by_seconds'的列表其中包含一天中所有秒钟的列表:

time_by_seconds = [['2016-07-08 02:00:00',
          '2016-07-08 02:00:01',
          '2016-07-08 02:00:02',
          '2016-07-08 02:00:03',
          '2016-07-08 02:00:04',
          '2016-07-08 02:00:05',
          '2016-07-08 02:00:06',
          etc                  ],
          ['2016-07-08 02:01:00',
           '2016-07-08 02:01:01',
           '2016-07-08 02:01:02',
           '2016-07-08 02:01:03',
           '2016-07-08 02:01:04',
          etc                  ]]

这是我打印项目的代码,如果它们在此列表中:

for item in dates_list:
    for one_list in time_by_seconds:
        if item in one_list:
            print item

结果如下:

2016-07-08 02:00:02
2016-07-08 02:00:17
2016-07-08 02:00:03
2016-07-08 02:00:20
2016-07-08 02:01:08
2016-07-08 02:00:09
2016-07-08 02:01:22
2016-07-08 02:01:33

但如果我使用另一个列表,长度为49,我有重复。具体而言,我必须有49个元素,因为所有这些日期都存在于我的time_by_seconds中。 这是清单:

beginning_time_list = ['2016-07-08 02:17:42',
 '2016-07-08 02:05:35',
 '2016-07-08 02:03:22',
 '2016-07-08 02:26:33',
 '2016-07-08 02:14:54',
 '2016-07-08 02:05:13',
 '2016-07-08 02:15:30',
 '2016-07-08 02:01:53',
 '2016-07-08 02:02:31',
 '2016-07-08 02:00:08',
 '2016-07-08 02:04:16',
 '2016-07-08 02:08:44',
 '2016-07-08 02:11:17',
 '2016-07-08 02:01:40',
 '2016-07-08 02:04:23',
 '2016-07-08 02:01:34',
 '2016-07-08 02:24:31',
 '2016-07-08 02:00:27',
 '2016-07-08 02:14:35',
 '2016-07-08 02:00:57',
 '2016-07-08 02:02:24',
 '2016-07-08 02:02:46',
 '2016-07-08 02:05:04',
 '2016-07-08 02:11:26',
 '2016-07-08 02:06:24',
 '2016-07-08 02:04:32',
 '2016-07-08 02:08:50',
 '2016-07-08 02:08:27',
 '2016-07-08 02:02:30',
 '2016-07-08 02:03:59',
 '2016-07-08 02:01:19',
 '2016-07-08 02:02:09',
 '2016-07-08 02:05:47',
 '2016-07-08 02:02:36',
 '2016-07-08 02:01:02',
 '2016-07-08 02:02:58',
 '2016-07-08 02:06:19',
 '2016-07-08 02:02:34',
 '2016-07-08 02:00:17',
 '2016-07-08 02:10:03',
 '2016-07-08 02:08:20',
 '2016-07-08 02:02:36',
 '2016-07-08 02:17:25',
 '2016-07-08 02:07:19',
 '2016-07-08 02:13:07',
 '2016-07-08 02:03:51',
 '2016-07-08 02:03:35',
 '2016-07-08 02:14:53',
 '2016-07-08 02:18:36']

相同的代码:

for item in beginning_time_list:
    for one_list in time_by_seconds:
        if item in one_list:
            print item

这就是结果:

2016-07-08 02:17:42
2016-07-08 02:17:42
2016-07-08 02:17:42
2016-07-08 02:17:42
2016-07-08 02:05:35
2016-07-08 02:05:35
2016-07-08 02:03:22
2016-07-08 02:26:33
2016-07-08 02:26:33
2016-07-08 02:26:33
2016-07-08 02:26:33
2016-07-08 02:26:33
2016-07-08 02:26:33
2016-07-08 02:14:54
2016-07-08 02:14:54
2016-07-08 02:14:54
2016-07-08 02:05:13
2016-07-08 02:05:13
2016-07-08 02:15:30
2016-07-08 02:15:30
2016-07-08 02:15:30
2016-07-08 02:15:30
2016-07-08 02:01:53
2016-07-08 02:02:31
2016-07-08 02:00:08
2016-07-08 02:04:16
2016-07-08 02:08:44
2016-07-08 02:08:44
2016-07-08 02:11:17
2016-07-08 02:11:17
2016-07-08 02:11:17
2016-07-08 02:01:40
2016-07-08 02:04:23
2016-07-08 02:01:34
2016-07-08 02:24:31
2016-07-08 02:24:31
2016-07-08 02:24:31
2016-07-08 02:24:31
2016-07-08 02:24:31
2016-07-08 02:00:27
2016-07-08 02:14:35
2016-07-08 02:14:35
2016-07-08 02:14:35
2016-07-08 02:00:57
2016-07-08 02:02:24
2016-07-08 02:02:46
2016-07-08 02:05:04
2016-07-08 02:05:04
2016-07-08 02:11:26
2016-07-08 02:11:26
2016-07-08 02:11:26
2016-07-08 02:06:24
2016-07-08 02:06:24
etc

抱歉有95件物品!

有人知道为什么我有重复? 日Thnx

3 个答案:

答案 0 :(得分:2)

为了在两个列表中找到共同元素,您可以使用set()作为:

>>> a = [1, 2, 3, 4]
>>> b = [3, 4, 5, 6]
>>> list(set(a).intersection(set(b)))
[3, 4]

在您的情况下,b是列表列表。您需要先将列表展平。为此,您可以使用itertools.chain()

>>> from itertools import chain
>>> a = [1, 2, 3, 4]
>>> b = [[3, 5, 6], [4, 8, 9]]
>>> list(set(a).intersection(set(chain.from_iterable((b)))))
[3, 4]

答案 1 :(得分:1)

在其中一个子列表中找到该项目后,搜索将继续进行其他子列表。

您应该考虑使用break,以便在其中一个子列表中找到当前日期项后停止搜索:

for item in beginning_time_list:
    for one_list in time_by_seconds:
        if item in one_list:
            print item
            break

答案 2 :(得分:0)

import collections

def flatten(iterable):
    for item in iterable:
        if isinstance(item, (str, bytes)):
            yield item
        if isinstance(item, collections.Sequence):
            yield from flatten(item)
        else:
            yield item


a = [1, 6, 10]
b = [[0, 1, 2], 3, [4], [5, (6, 7), 8], 9]

common_items = set(a) & set(flatten(b))