将列表中的项目替换为元组中的项目

时间:2018-11-27 13:34:46

标签: python list tuples

当前,我正在尝试统一rpm软件包中的许可证名称。

因此,我解析rpm,以列表的形式获取许可证信息,并希望将这些列表与我构建的查找表进行比较。

这里是一个例子:

lic = ['GPLv2', ' & ', 'LGPLv2+', ' & ', 'LGPLv2.1+', ' | ', 'LGPLv3+']

duplicates = (
            ('GPL-2.0', 'GPL-2', 'GPLv2', 'GPLv2.0'),
            ('GPL-2.0+', 'GPL-2+', 'GPLv2+', 'GPLv2.0+'),
            ('GPL-3.0', 'GPL-3', 'GPLv3', 'GPLv3.0'),
            ('GPL-3.0+', 'GPL-3+', 'GPLv3+', 'GPLv3.0+'),
            ('LGPL-2.0', 'LGPLv2.0', 'LGPLv2', 'LGPL2'),
            ('LGPL-2.0+', 'LGPLv2.0+', 'LGPLv2+', 'LGPL2+'),
            ('LGPL-2.1', 'LGPLv2.1', 'LGPL2.1'),
            ('LGPL-2.1+', 'LGPLv2.1+', 'LGPL2.1+'),
            ('LGPL-3.0', 'LGPLv3.0', 'LGPLv3', 'LGPL3'),
            ('LGPL-3.0+', 'LGPLv3.0+', 'LGPLv3+', 'LGPL3+')
            )

用每个元组的对应第一个元素替换duplicateslicselect code, dense_rank() over (order by code) as ranking from t; 中任何元素的所有出现的最有效,最Python方式是什么?

例如: GPLv2 需要替换为 GPL-2.0 LGPLv2 + LGPL-2.0 + 以及等等。

我使用的是Python 3.5.2

2 个答案:

答案 0 :(得分:1)

我首先将duplicates元组的元组修改为字典。像这样:

duplicates = {k: v for k, *v in duplicates}  # {'GPL-2.0': ['GPL-2', 'GPLv2', 'GPLv2.0'], ...}

然后执行:

lic_clean = [next((k for k, v in duplicates.items() if x in v), x) for x in lic]

产生:

['GPL-2.0', ' & ', 'LGPL-2.0+', ' & ', 'LGPL-2.1+', ' | ', 'LGPL-3.0+']

答案 1 :(得分:0)

您可以遍历lic并将其每个元素与duplicates进行比较,如果找到匹配项,则将该元素替换为匹配元组的第一个元素。

lic = ['GPLv2', ' & ', 'LGPLv2+', ' & ', 'LGPLv2.1+', ' | ', 'LGPLv3+']

duplicates = (
            ('GPL-2.0', 'GPL-2', 'GPLv2', 'GPLv2.0'),
            ('GPL-2.0+', 'GPL-2+', 'GPLv2+', 'GPLv2.0+'),
            ('GPL-3.0', 'GPL-3', 'GPLv3', 'GPLv3.0'),
            ('GPL-3.0+', 'GPL-3+', 'GPLv3+', 'GPLv3.0+'),
            ('LGPL-2.0', 'LGPLv2.0', 'LGPLv2', 'LGPL2'),
            ('LGPL-2.0+', 'LGPLv2.0+', 'LGPLv2+', 'LGPL2+'),
            ('LGPL-2.1', 'LGPLv2.1', 'LGPL2.1'),
            ('LGPL-2.1+', 'LGPLv2.1+', 'LGPL2.1+'),
            ('LGPL-3.0', 'LGPLv3.0', 'LGPLv3', 'LGPL3'),
            ('LGPL-3.0+', 'LGPLv3.0+', 'LGPLv3+', 'LGPL3+')
            )

for idx, i in enumerate(lic):
    for match in duplicates:
        if i in match:
            lic[idx] = match[0]
            break

print(lic)

输出:

['GPL-2.0', ' & ', 'LGPL-2.0+', ' & ', 'LGPL-2.1+', ' | ', 'LGPL-3.0+']