有没有办法在使用operator.itemgetter()作为排序键时强制转换值?

时间:2017-03-27 20:11:17

标签: python python-3.x sorting lambda

我有一个包含字符串代表数字的列表列表:

nums = [['1','3'],['2','2'],['1','2'],['0','2'],['11','2']]

我需要通过第一个和第二个条目对这些数字进行排序,而不修改原始列表中数字的字符串表示。此外,想要避免创建另一个列表的第二个副本,其中所有内容都明确映射到整数 - 想象这是一个巨大的列表。

sort()sorted()都可以很好地处理元组和列表,所以使用lambda键,我可以执行以下操作:

>>> sorted(nums, key=lambda n: (int(n[0]),int(n[1])) 
[['0', '2'], ['1', '2'], ['1', '3'], ['2', '2'], ['11', '2']]

快乐的日子......

然而,我已经看到一些关于使用operator.itemgetter()作为关键函数使用lambda进行排序的更快的帖子。 如果没有讨论这些声明的有效性,那么在使用operator.itemgetter()时,是否有可能应用从字符串到整数的转换进行比较:

由于字符串被比较为字符串而不是数字,以下显然会失败:

>>> sorted(nums, key=operator.itemgetter(0,1)) 
[['0', '2'], ['1', '2'], ['1', '3'], ['11', '2'], ['2', '2']]

2 个答案:

答案 0 :(得分:4)

operator.itemgetter速度快,不是因为它在sort中做了一些特殊的事情,而是因为它完全是written in c,并且不涉及调用python函数。

所以你正在寻找的是一个 C函数可以做你想做的事情 - itemgetter是一个红色的鲱鱼。

在python 2中,你可以避免使用key=functools.partial(map, int)调用pure-python函数。这在python 3中不起作用,因为map不再返回列表或元组。这也可能不比你的解决方案快。

答案 1 :(得分:3)

有一些方法,例如使用iteration_utilities.chained 1 functools.partial

>>> import operator import itemgetter
>>> from iteration_utilities import chained
>>> from functools import partial

>>> itemgetter_int = chained(operator.itemgetter(0, 1), partial(map, int), tuple)
>>> sorted(nums, key=itemgetter_int)
[['0', '2'], ['1', '2'], ['1', '3'], ['2', '2'], ['11', '2']]

它可以工作,但它比使用lambda或自定义函数要慢得多。

如果你真的需要速度,你可以对lambda - 函数进行cython化(或者用C语言编写),但是如果你只需要在一个地方使用它就可以使用丢弃lambda。特别是如果它在sorted中,因为它具有O(nlog(n))比较,因此O(n)函数调用可能对总体执行时间没有多大贡献。

1:这是我撰写的3rd party extension module中的一个函数。它需要单独安装,例如通过condapip