Question

我有一个如下所示的列表，其中第一个元素是id，另一个是字符串：

[(1, u'abc'), (2, u'def')]

我想只从这个元组列表中创建一个id列表，如下所示：

[1,2]

我将在__in中使用此列表，因此它必须是整数值列表。

Answer 1

>>> a = [(1, u'abc'), (2, u'def')]
>>> [i[0] for i in a]
[1, 2]

Answer 2

使用zip功能解耦元素：

>>> inpt = [(1, u'abc'), (2, u'def')]
>>> unzipped = zip(*inpt)
>>> print unzipped
[(1, 2), (u'abc', u'def')]
>>> print list(unzipped[0])
[1, 2]

编辑（@ BradSolomon）：以上适用于Python 2.x，其中zip返回一个列表。

在Python 3.x中，zip返回一个迭代器，以下内容等同于上述内容：

>>> print(list(list(zip(*inpt))[0]))
[1, 2]

Answer 3

你是说这样的意思吗？

new_list = [ seq[0] for seq in yourlist ]

您实际拥有的是tuple个对象列表，而不是集合列表（正如您的原始问题所暗示的那样）。如果它实际上是一个集合列表，则没有第一个元素，因为集合没有订单。

这里我创建了一个平面列表，因为这通常比创建1个元素元组的列表更有用。但是，只需将seq[0]替换为(seq[0],)，即可轻松创建1个元素元组的列表。

Answer 4

您可以使用＆＃34; tuple unpacking＆＃34;：

>>> my_list = [(1, u'abc'), (2, u'def')]
>>> my_ids = [idx for idx, val in my_list]
>>> my_ids
[1, 2]

在迭代时，每个元组都被解压缩，其值被设置为变量idx和val。

>>> x = (1, u'abc')
>>> idx, val = x
>>> idx
1
>>> val
u'abc'

Answer 5

这是operator.itemgetter的用途。

var data = {
	'Category xxxx': [
	{ units: 1234, subcategory: 'wolves', name: 'Starks' }, 
	{ units: 1345354, subcategory: 'wolves', name: 'Starks' }, 
	{ units: 666, subcategory: 'dragons', name: 'Targaryens' }
	],
	'Category yyyy': [
	{ units: 7783, subcategory: 'lions', name: 'Lanisters' }, 
	{ units: 1267878, subcategory: 'spires', name: 'Martells' }
	]
};

var result = {};

Object.keys(data).forEach(function (key) {
	var hash = {};
	data[key].forEach(function (v, k) {
		isNaN(hash[(k = v.subcategory + v.name)]) ?
			(hash[k] = this.push(v) - 1) :
			(this[hash[k]].units += v.units);
	}, (this[key] = []));
}, result);

console.log(result)

>>> a = [(1, u'abc'), (2, u'def')] >>> import operator >>> b = map(operator.itemgetter(0), a) >>> b [1, 2]语句返回一个函数，它返回您指定的元素的索引。这和写作完全一样

itemgetter

但我发现>>> b = map(lambda x: x[0], a)更清晰，more explicit。

这对于生成紧凑的排序语句很方便。例如，

itemgetter

Answer 6

我当时认为比较不同方法的运行时可能有用，所以我做了一个基准测试（使用simple_benchmark库）

I）具有包含2个元素的元组的基准

您可能希望通过索引0从元组中选择第一个元素，这显示出是最快的解决方案，非常接近拆包解决方案，因为它恰好需要2个值

import operator
import random

from simple_benchmark import BenchmarkBuilder

b = BenchmarkBuilder()



@b.add_function()
def rakesh_by_index(l):
    return [i[0] for i in l]


@b.add_function()
def wayneSan_zip(l):
    return list(list(zip(*l))[0])


@b.add_function()
def bcattle_itemgetter(l):
     return list(map(operator.itemgetter(0), l))


@b.add_function()
def ssoler_upacking(l):
    return [idx for idx, val in l]

@b.add_function()
def kederrack_unpacking(l):
    return [f for f, *_ in l]



@b.add_arguments('Number of tuples')
def argument_provider():
    for exp in range(2, 21):
        size = 2**exp
        yield size, [(random.choice(range(100)), random.choice(range(100))) for _ in range(size)]


r = b.run()
r.plot()

II）具有包含2个或更多元素的元组的基准

import operator
import random

from simple_benchmark import BenchmarkBuilder

b = BenchmarkBuilder()

@b.add_function()
def kederrack_unpacking(l):
    return [f for f, *_ in l]


@b.add_function()
def rakesh_by_index(l):
    return [i[0] for i in l]


@b.add_function()
def wayneSan_zip(l):
    return list(list(zip(*l))[0])


@b.add_function()
def bcattle_itemgetter(l):
     return list(map(operator.itemgetter(0), l))


@b.add_arguments('Number of tuples')
def argument_provider():
    for exp in range(2, 21):
        size = 2**exp
        yield size, [tuple(random.choice(range(100)) for _
                     in range(random.choice(range(2, 100)))) for _ in range(size)]

from pylab import rcParams
rcParams['figure.figsize'] = 12, 7

r = b.run()
r.plot()

Answer 7

如果元组是唯一的，那么这可以工作

>>> a = [(1, u'abc'), (2, u'def')]
>>> a
[(1, u'abc'), (2, u'def')]
>>> dict(a).keys()
[1, 2]
>>> dict(a).values()
[u'abc', u'def']
>>>

Answer 8

从性能的角度来看，在python3.X

中

[i[0] for i in a]和list(zip(*a))[0]相同
它们比list(map(operator.itemgetter(0), a))

<强>代码

import timeit


iterations = 100000
init_time = timeit.timeit('''a = [(i, u'abc') for i in range(1000)]''', number=iterations)/iterations
print(timeit.timeit('''a = [(i, u'abc') for i in range(1000)]\nb = [i[0] for i in a]''', number=iterations)/iterations - init_time)
print(timeit.timeit('''a = [(i, u'abc') for i in range(1000)]\nb = list(zip(*a))[0]''', number=iterations)/iterations - init_time)

<强>输出

3.491014136001468e-05

3.422205176000717e-05

Answer 9

当我跑步时（如上所述）：

>>> a = [(1, u'abc'), (2, u'def')]
>>> import operator
>>> b = map(operator.itemgetter(0), a)
>>> b

而不是返回：

[1, 2]

我收到了这个作为回报：

<map at 0xb387eb8>

我发现我必须使用list（）：

>>> b = list(map(operator.itemgetter(0), a))

使用此建议成功返回列表。也就是说，我对这个解决方案很满意，谢谢。（使用Spyder，iPython控制台，Python v3.6测试/运行）

Answer 10

我想知道为什么没人建议使用numpy，但是现在检查后我明白了。对于混合类型数组，可能不是最好的方法。

这将是numpy中的解决方案：

>>> import numpy as np

>>> a = np.asarray([(1, u'abc'), (2, u'def')])
>>> a[:, 0].astype(int).tolist()
[1, 2]

Answer 11

那些是元组，而不是集合。你可以这样做：

l1 = [(1, u'abc'), (2, u'def')]
l2 = [(tup[0],) for tup in l1]
l2
>>> [(1,), (2,)]

Answer 12

您可以unpack使用元组列表理解元组并仅获取第一个元素：

l = [(1, u'abc'), (2, u'def')]
[f for f, *_ in l]

输出：

[1, 2]

无论元组中有多少个元素，这都将起作用：

l = [(1, u'abc'), (2, u'def', 2, 4, 5, 6, 7)]
[f for f, *_ in l]

输出：

[1, 2]

Answer 13

要获取列表或元组的元素，您可以遍历列表或元组

a = [(1, u'abc'), (2, u'def')]

list1 = [a[i][0] for i in range(len(a))]

print(list1)

如何获取元组列表中的第一个元素？

13 个答案: