我有一个包含字符串代表数字的列表列表:
nums = [['1','3'],['2','2'],['1','2'],['0','2'],['11','2']]
我需要通过第一个和第二个条目对这些数字进行排序,而不修改原始列表中数字的字符串表示。此外,想要避免创建另一个列表的第二个副本,其中所有内容都明确映射到整数 - 想象这是一个巨大的列表。
sort()
和sorted()
都可以很好地处理元组和列表,所以使用lambda键,我可以执行以下操作:
>>> sorted(nums, key=lambda n: (int(n[0]),int(n[1]))
[['0', '2'], ['1', '2'], ['1', '3'], ['2', '2'], ['11', '2']]
快乐的日子......
然而,我已经看到一些关于使用operator.itemgetter()
作为关键函数使用lambda进行排序的更快的帖子。 如果没有讨论这些声明的有效性,那么在使用operator.itemgetter()
时,是否有可能应用从字符串到整数的转换进行比较:
由于字符串被比较为字符串而不是数字,以下显然会失败:
>>> sorted(nums, key=operator.itemgetter(0,1))
[['0', '2'], ['1', '2'], ['1', '3'], ['11', '2'], ['2', '2']]
答案 0 :(得分:4)
operator.itemgetter
速度快,不是因为它在sort
中做了一些特殊的事情,而是因为它完全是written in c,并且不涉及调用python函数。
所以你正在寻找的是一个 C函数可以做你想做的事情 - itemgetter
是一个红色的鲱鱼。
在python 2中,你可以避免使用key=functools.partial(map, int)
调用pure-python函数。这在python 3中不起作用,因为map
不再返回列表或元组。这也可能不比你的解决方案快。
答案 1 :(得分:3)
有一些方法,例如使用iteration_utilities.chained
1 和functools.partial
:
>>> import operator import itemgetter
>>> from iteration_utilities import chained
>>> from functools import partial
>>> itemgetter_int = chained(operator.itemgetter(0, 1), partial(map, int), tuple)
>>> sorted(nums, key=itemgetter_int)
[['0', '2'], ['1', '2'], ['1', '3'], ['2', '2'], ['11', '2']]
它可以工作,但它比使用lambda
或自定义函数要慢得多。
如果你真的需要速度,你可以对lambda
- 函数进行cython化(或者用C语言编写),但是如果你只需要在一个地方使用它就可以使用丢弃lambda
。特别是如果它在sorted
中,因为它具有O(nlog(n))
比较,因此O(n)
函数调用可能对总体执行时间没有多大贡献。
1:这是我撰写的3rd party extension module中的一个函数。它需要单独安装,例如通过conda
或pip
。