发现在嵌套列表的独特元素

时间:2019-02-01 10:51:55

标签: python python-3.x

如果我有一个列表的 MYLIST = [ “[AMN,B,C]”, “[ '一个,d,E']”, “[ 'F,B,E']”] ,并且我需要将所有唯一元素都列为 [amn,b,c,d,e,f] 的单个列表,该怎么做?

我试图创建一个功能,并且也尝试了一些其他方法,但是没有效果。

功能:

mylist = ["[amn,b,c]", "[‘a,d,e’]", "[‘f,b,e’]"]

def print_list(the_list):

for each_item in the_list:

    if isinstance(each_item, list):

        print_list(each_item)

    else:

        print(each_item)

print_list(mylist)

输出:

[amn,b,c]

[‘a,d,e’]

[‘f,b,e’]

其他方法:

mylist = ["[amn,b,c]", "[‘a, d,e’]", "[‘f,b,e’]"]

mylist = str(mylist)

mylist = str(mylist)

mylist = [str(x) for x in (mylist)]

mylist = set(mylist)

i = {' ', "'", ',', '[', ']','‘', '’'}

mylist.difference_update(i)

mylist = list(mylist)

mylist.sort()

mylist

输出:

['a', 'b', 'c', 'd', 'e', 'f', 'm', 'n']

预期结果:

[amn,b,c,d,e,f]

实际结果:

功能:

[amn,b,c]

[‘a,d,e’]

[‘f,b,e’]

用另一方法:

['a', 'b', 'c', 'd', 'e', 'f', 'm', 'n']

4 个答案:

答案 0 :(得分:1)

您可以使用以下列表理解,其中使用re.sub来删除不需要的字符,并使用.split并按,进行拆分来获得基础列表。

最后,为了从嵌套列表中获取唯一元素,您可以使用itertools.chain展平嵌套列表,并从结果中生成set以便保留唯一值:

import re
from itertools import chain
set(chain(*[re.sub(r'[\[‘’\"\]]', '', i).split(',') for i in mylist]))
{'a', 'amn', 'b', 'c', 'd', 'e', 'f'}

位置:

[re.sub(r'[\[‘’\"\]]', '', i).split(',') for i in mylist]
[['amn', 'b', 'c'], ['a', 'd', 'e'], ['f', 'b', 'e']]

答案 1 :(得分:0)

我不得不用不同的方式重新定义列表,因为在您有1个带有字符串的列表之前。如果这是错误的,请告诉我,但是我很好奇您为什么要列出类似列表的字符串。

mylist = [['amn','b','c'], ['a','d','e'], ['f','b','e']]
unique_list = []

def find_all_unique(input, unique_list):
    if type(input) is list:
        return [find_all_unique(x, unique_list) for x in input if x is not None]
    if type(input) is str:
        if input not in unique_list:
            unique_list.append(input)

find_all_unique(mylist, unique_list)
print(unique_list)

结果:

['amn', 'b', 'c', 'a', 'd', 'e', 'f']
[Finished in 0.081s]

或者如果您需要将嵌套列表保留在引号内,则可以使用以下方法:

mylist = [['amn','b','c', "['r','t','x']"], ['a','d','e'], ['f','b','e']]
unique_list = []

def find_all_unique(input, unique_list):
    if type(input) is list:
        return [find_all_unique(x, unique_list) for x in input if x is not None]
    if type(input) is str:
        if input.startswith('['):
            temp_list=[]
            exec("temp_list.append(" + input + ')', {"temp_list":temp_list})
            return [find_all_unique(x, unique_list) for x in temp_list if x is not None]
        elif input not in unique_list:
            unique_list.append(input)

find_all_unique(mylist, unique_list)
print(unique_list)

为了测试这一点,我添加了一个字符串列表"['r','t','x']",它应该捕获rtx作为唯一输入

结果如下:

['amn', 'b', 'c', 'r', 't', 'x', 'a', 'd', 'e', 'f']
[Finished in 0.077s]

无论该功能是列表列表还是字符串列表,都可以使用,因为该函数是递归的。

答案 2 :(得分:0)

首先,我将尝试用,(逗号),'(单引号),[](用模式匹配用空字符串打开方括号来代替),然后删除重复项使用set,并使用list重建列表,如下所示:

my_list = ["[amn,b,c]", "['a, d,e']", "['f,b,e']"]

result = sorted(list(set(([letter for word in my_list for letter in re.sub(',|\'|\[|]|\s+', '', word)]))))

print(result)

其中

re.sub(',|\'|\[|]|\s+', '', word)]) 

将替换字符串中的特殊字符。例如,['a, d,e']ade

基于理解的解决方案在技术上等于

result = []

for word in my_list:  # Break list of lists to lists
    word = re.sub(',|\'|\[|]|\s+', '', word)
    for letter in word:  # Process each word in the sub list
        result.append(letter)

print('results with duplicates:    ', result)  # List with possible duplicates
result = set(result)  # Remove duplicates by converting to a set

result = list(result)  # Convert set back to list without duplicates (order is not preserved)
print('results without duplicates: ', result)

result = sorted(result)
print('results in sorted order:    ', result)

结果为

results with duplicates:     ['a', 'm', 'n', 'b', 'c', 'a', 'd', 'e', 'f', 'b', 'e']
results without duplicates:  ['e', 'a', 'd', 'm', 'f', 'c', 'n', 'b']
results in sorted order:     ['a', 'b', 'c', 'd', 'e', 'f', 'm', 'n']

答案 3 :(得分:0)

dd = []
mylist = ["[amn,b,c]", "[‘a,d,e’]", "[‘f,b,e’]"]
for i in mylist:
    dd.extend([''.join(filter(str.isalnum, j)) for j in i.split(",")])
print (list(set(dd)))
#output ['f', 'a', 'b', 'amn', 'c', 'd', 'e']