如何根据这些项是否在另一个列表中,从一个项到另一个项对列表中的内容进行分组?

时间:2017-10-12 23:27:42

标签: python list grouping

我有以下列表:

x = ['0001', 'Random message XYX', 'Random second message IAI', '0002', 'Random message IAM', 'Random second message OMA', 'Random third message OMA', '0003', 'Random message XAK', 'Random second message YAB', '0004', ' Random message INA']

我还有另一个清单

y = ['0001', '0002', '0003', '0004']

我想根据 y 组对列表 x 进行分组,以便输出为:

x = [['0001', 'Random message XYX', 'Random second message IAI'], ['0002', 'Random message IAM', 'Random second message OMA', 'Random third message OMA'], ['0003', 'Random message XAK', 'Random second message YAB'], ['0004', ' Random message INA']]

我试过了:

x = ['0001', 'Random message XYX', 'Random second message IAI', '0002', 'Random message IAM', 'Random second message OMA', 'Random third message OMA', '0003', 'Random message XAK', 'Random second message YAB', '0004', ' Random message INA']

y = ['0001', '0002','0003', '0004']

grouped_list = []
for entry in x:
    if entry in y:
        new_list = []
        new_list.append(entry)
        for i in range(x.index(entry)+1, len(x)):
            if(x[i][0] not in y):
                new_list.append(x[i])
            else:
                break
        grouped_list.append(list(new_list))
print (grouped_list)

然而,这只是打印 []

有人可以告诉我我需要做些什么来打印我之后的输出吗?

编辑:

我使用y.luis'做了一些改变。回答哪个适用于此示例,但是我在使用实际数据时发现了一个问题。我在两个列表中都有重复的条目,这导致它覆盖 x 列表中的数据,而不仅仅是对它进行分组。如果运行此代码,则会覆盖 x 列表的最后一部分:

x = ['0001', 'Random message XYX', 'Random second message IAI', '0002', 'Random message IAM', 'Random second message OMA', 'Random third message OMA', '0003', 'Random message XAK', 'Random second message YAB', '0004', ' Random message INA', '0001', 'Random message ryryry', 'Random second message ryyryyryryry']

y = ['0001', '0002','0003', '0004', '0001', '0002']

grouped_list = []
for entry in x:
    if entry in y:
        new_list = []
        new_list.append(entry)
        for i in range(x.index(entry)+1, len(x)):
            if(x[i] not in y):
                new_list.append(x[i])
            else:
                break
        grouped_list.append(list(new_list))
print (grouped_list)

有人可以告诉我如何避免这种情况吗?

2 个答案:

答案 0 :(得分:1)

您最内在的if

中存在错误
if(x[i][0] not in y):

这里你要检查项目的第一个字符是否在列表中。它应该是:

if(x[i] not in y):

如果您想避免重复组密钥,可以使用字典:

grouped_list = []
d = {}
i = 0
current_key = None

while i < len(x):

    if x[i] in y:
        current_key = x[i]
        if not d.has_key(current_key):
            d[current_key] = []
        i += 1
        continue

    while i < len(x) and x[i] not in y:
        d[current_key].append(x[i])
        i += 1

for k in d:
    grouped_list.append([k] + d[k])

print (grouped_list)

答案 1 :(得分:1)

两个班轮怎么样? (对不起,不能在一行中完成)

# At the top of your .py file    
from __future__ import print_function

x = ['0001', 'Random message XYX', 'Random second message IAI', '0002', 'Random message IAM', 'Random second message OMA', 'Random third message OMA', '0003', 'Random message XAK', 'Random second message YAB', '0004', ' Random message INA']
y = ['0001', '0002', '0003', '0004']

indexes = [k for k in [x.index(toks) for toks in y]]
print([x[i:j] for i, j in zip(indexes, indexes[1:]+[len(x)])])

给我

[['0001', 'Random message XYX', 'Random second message IAI'],
 ['0002',
  'Random message IAM',
  'Random second message OMA',
  'Random third message OMA'],
 ['0003', 'Random message XAK', 'Random second message YAB'],
 ['0004', ' Random message INA']]