使用另一个列表在Python列表中对字符串进

时间:2016-01-19 19:55:10

标签: python sorting secondary-sort

说我有以下列表:

List1=['Name1','Name3','Color1','Size2','Color3','Color2','Name2','Size1', 'ID']
List2=['ID','Color1','Color2','Size1','Size2','Name1','Name2']

每个列表都有名为" ID"变量,然后是3个其他类别(名称,颜色和大小),每个类别中都有未确定数量的元素。

我想对这些变量进行排序,而不知道每个类别中有多少变量,以及以下排序列表':

SortList=['ID','Name','Size','Color']

我可以得到所需的输出(见下文),虽然我想有更好/更pythonic的方式这样做。

>>> def SortMyList(MyList,SortList):       
...     SortedList=[]       
...     for SortItem in SortList:
...         SortItemList=[]
...         for Item in MyList:
...             ItemWithoutNum="".join([char for char in Item if char.isalpha()])  
...             if SortItem==ItemWithoutNum:
...                 SortItemList.append(Item)
...         if len(SortItemList)>1:
...             SortItemList=[SortItem+str(I) for I in range(1,len(SortItemList)+1)]
...         for SortedItem in SortItemList:
...             SortedList.append(SortedItem)
...     return SortedList
... 
>>> 
>>> SortMyList(List1, SortList)
['ID', 'Name1', 'Name2', 'Name3', 'Size1', 'Size2', 'Color1', 'Color2', 'Color3']
>>> SortMyList(List2, SortList)
['ID', 'Name1', 'Name2', 'Size1', 'Size2', 'Color1', 'Color2']
>>> 

有关如何改进我的方法或代码的任何建议吗?

4 个答案:

答案 0 :(得分:5)

您可以使用自定义键功能对列表进行排序,该功能返回2元组,用于主要排序和辅助排序。

主要排序按照“标签”的顺序排列(首先是ID,然后是名称等)。 二级排序是通过它后面的数值。

tags = ['ID','Name','Size','Color']
sort_order = { tag : i for i,tag in enumerate(tags) }

def elem_key(x):
    for tag in tags:
        if x.startswith(tag):
            suffix = x[len(tag) : ]
            return ( sort_order[tag],
                     int(suffix) if suffix else None )
    raise ValueError("element %s is not prefixed by a known tag. order is not defined" % x)

list1.sort(key = elem_key)

答案 1 :(得分:1)

您可以提供足够的密钥:

<input type="button" onclick="deleteRow(this)">X</button>

元素将按第一个字母排序,然后按最后一个数字排序(如果存在)。它适用于此,因为所有首字母都不同,如果数字最多只有一位数。

编辑

对于许多数字,一个更加模糊的解决方案:

btn.setAttribute('onclick','deleteRow(this)');

答案 2 :(得分:0)

是否(在这种情况下)更容易从字符串中提取数据而不是简单的正则表达式?

import re

def keygen(sort_list):
    return lambda elem: (
        sort_list.index(re.findall(r'^[a-zA-Z]+', elem)[0]),
        re.findall(r'\d+$', elem)
    )

用法:

   SortList = ['ID', 'Name', 'Size', 'Color']
   List1 = ['Name1', 'Name3', 'Color1', 'Size2', 'Color3', 'Color2','Name2', 'Size1', 'ID']
   List2 = ['ID', 'Color1', 'Color2', 'Size1', 'Size2', 'Name1', 'Name2']
   sorted(List1, key=keygen(SortList))
=> ['ID', 'Name1', 'Name2', 'Name3', 'Size1', 'Size2', 'Color1', 'Color2', 'Color3']
   sorted(List2, key=keygen(SortList))
=> ['ID', 'Name1', 'Name2', 'Size1', 'Size2', 'Color1', 'Color2']

说明:

^[a-zA-Z]+匹配开头的字母部分,以及字符串末尾的\d$ - 数字部分。

keygen返回带有字符串的lambda,并返回两项元组:
第一项是列表中字母部分的位置(列表中没有这样的项目= ValueError),
第二个是包含数字部分的单项列表,如果字符串不以数字结尾,则为空列表。

一些可能的改进:

  • sort_list.index调用O(n),将为列表中的每个元素调用它;可以用O(1) dict查找替换以加快排序(我没有这样做以保持简单),
  • 数字部分可以被赋予实际整数 (1 < 2 < 10,但'1' < '10' < '2'

应用后:

import re

def keygen(sort_list):
    index = {(word, index) for index, word in enumerate(sort_slist)}
    return lambda elem: (
        index[re.findall(r'^[a-zA-Z]+', elem)[0]],
        [int(s) for s in re.findall(r'\d+$', elem)]
    )

答案 3 :(得分:0)

只要您知道List2只包含以sortList

中的内容开头的字符串,这就有效
List2=['ID','Color4','Color2','Size1','Size2','Name2','Name1']
sortList=['ID','Name','Size','Color']
def sort_fun(x):
    for i, thing in enumerate(sortList):
        if x.startswith(thing):
            return (i, x[len(thing):])

print sorted(List2, key=sort_fun)