我有以下数据:
data = [['AB', 'BS, BT'], ['AH', 'AH'], ['AS', 'AS, GS']]
我想遍历列表列表以生成元组列表。
new_data = [('AB', 'BS'), ('AB', 'BT'), ('AH', 'AH'), ('AS', 'AS') ('AS', 'GS')]
我正在考虑使用zip()函数,但不确定我是否使用了正确的逻辑。
答案 0 :(得分:2)
zip
不是我的首选。我的第一选择是itertools.product
和itertools.chain
In [103]: data = [['AB', 'BS, BT'], ['AH', 'AH'], ['AS', 'AS, GS']]
In [104]: [list(itertools.product([d[0]], d[1].split(','))) for d in data]
Out[104]: [[('AB', 'BS'), ('AB', ' BT')], [('AH', 'AH')], [('AS', 'AS'), ('AS', ' GS')]]
In [105]: list(itertools.chain.from_iterable([list(itertools.product([d[0]], d[1].split(','))) for d in data]))
Out[105]: [('AB', 'BS'), ('AB', ' BT'), ('AH', 'AH'), ('AS', 'AS'), ('AS', ' GS')]
希望这有帮助
答案 1 :(得分:1)
使用itertools.repeat()
可以轻松完成此操作。我们使用它来重复每个其他项目的第一项,我们通过分割","
得到,然后拉上来生成我们的元组。然后,我们使用itertools.chain.from_iterable()
生成一个列表。
>>> import itertools
>>> data = [['AB', 'BS, BT'], ['AH', 'AH'], ['AS', 'AS, GS']]
>>> for item in itertools.chain.from_iterable(zip(itertools.repeat(first), second.split(",")) for first, second in data):
... print(item)
...
('AB', 'BS')
('AB', ' BT')
('AH', 'AH')
('AS', 'AS')
('AS', ' GS')
答案 2 :(得分:0)
使用zip()
:
In [32]: data
Out[32]: [['AB', 'BS, BT'], ['AH', 'AH'], ['AS', 'AS, GS']]
In [33]: [zip([x[0]]*len(x[1].split(",")),x[1].split(",")) for x in data]
Out[33]: [[('AB', 'BS'), ('AB', ' BT')], [('AH', 'AH')], [('AS', 'AS'), ('AS', ' GS')]]
使用chain()
获得预期的输出:
In [34]: lis=[zip([x[0]]*len(x[1].split(",")),x[1].split(",")) for x in data]
In [35]: list(chain(*lis))
Out[35]: [('AB', 'BS'), ('AB', ' BT'), ('AH', 'AH'), ('AS', 'AS'), ('AS', ' GS')]
使用izip_longest
,fillvalue
等于每个子列表的第一个元素:
In [47]: from itertools import chain,izip_longest
In [48]: lis=[tuple(izip_longest([x[0]],x[1].split(","),fillvalue=x[0])) for x in data]
In [49]: lis
Out[49]: [(('AB', 'BS'), ('AB', ' BT')), (('AH', 'AH'),), (('AS', 'AS'), ('AS', ' GS'))]
In [50]: list(chain(*lis))
Out[50]: [('AB', 'BS'), ('AB', ' BT'), ('AH', 'AH'), ('AS', 'AS'), ('AS', ' GS')]