按数字降序输出两个组合列表中的项目?

时间:2015-02-01 18:55:36

标签: python arrays file-io text-files

我有一个如下所示的txt文件:

  

拉​​吉乔伊:9,8,1

     

张,John:8

     

坎贝尔,米歇尔:5,7,9

注意:文本文件

中的文本行之间没有空行

我想以降序的数字顺序输出每个人的每个结果,例如

  坎贝尔,米歇尔:9

     

拉​​吉乔伊:9

     

拉​​吉乔伊:8

     

张,John:8

     

坎贝尔,米歇尔:7

     

到目前为止我的代码是:

            data = src.readlines()
            for line in data:
                record = line.split(':')
                scoreList = record[1].split(',')
                # Add name to fileRecord
                for n in scoreList:
                    fileRecord.append(record[0])

                # Two dimensional list created, each item is one set of scores
                fileScores.append(scoreList)

其中src是文本文件。 对我提出的主要问题是,如果我在sortList上调用.sort(),我会丢失顺序,因此无法将每个分数与其对应的名称相匹配。如果我要创建一个字典,那么问题就是将排序后的数据单独输出为排序

  

{" Raj,Joy":[9,8,1]等}

不会按照" Raj,Joy"得到了,但我不能拆分列表,因为那时我会有重复的密钥。

5 个答案:

答案 0 :(得分:2)

您已填充fileRecordfileScores。现在你将它们组合起来并排序:

>>> fileRecord = ['Raj,Joy', 'Smith,John', 'Campbell,Michelle']

>>> fileScores = [[9, 8, 1], [8], [5, 7, 9]]

>>> comb = []

>>> for record, scores in zip(fileRecord, fileScores):
...     for score in scores:
...         comb.append((record, score))
...         

>>> comb
>>> 
[('Raj,Joy', 9),
 ('Raj,Joy', 8),
 ('Raj,Joy', 1),
 ('Smith,John', 8),
 ('Campbell,Michelle', 5),
 ('Campbell,Michelle', 7),
 ('Campbell,Michelle', 9)]

>>> comb.sort(key=lambda item: item[1], reverse=True)

>>> comb
>>> 
[('Raj,Joy', 9),
 ('Campbell,Michelle', 9),
 ('Raj,Joy', 8),
 ('Smith,John', 8),
 ('Campbell,Michelle', 7),
 ('Campbell,Michelle', 5),
 ('Raj,Joy', 1)]

您可能希望在Python 2中使用itertools.izip而不是内置的zip

答案 1 :(得分:2)

打开文件并在每行str.rpartition将名称中的数字隔离开来。然后构建一个生成器,使用每个数字扩展名称,对其进行排序,然后执行输出所需的任何操作,例如:

<强>代码:

with open('input_file') as fin:
    name_nums = (line.rpartition(':')[::2] for line in fin)
    expanded = ((name, int(n)) for name, num in name_nums for n in num.split(','))
    ordered = sorted(expanded, key=lambda L: L[1], reverse=True)
    for name, num in ordered:
        print '{}:{}'.format(name, num)

<强>输出

Raj,Joy:9
Campbell,Michelle:9
Raj,Joy:8
Smith,John:8
Campbell,Michelle:7
Campbell,Michelle:5
Raj,Joy:1

答案 2 :(得分:0)

您可以将sorted功能用于key

>>> s="""Raj,Joy:9,8,1
... 
... Smith,John:8
... 
... Campbell,Michelle:5,7,9"""

>>> l=s.split('\n\n')
>>> from itertools import chain    
>>> for i in sorted(chain(*[[(i[0],j) for j in i[1].split(',')] for i in [i.split(':') for i in l]]),key=lambda x: x[1],reverse=True) :
...   print ':'.join(i)
... 
Raj,Joy:9
Campbell,Michelle:9
Raj,Joy:8
Smith,John:8
Campbell,Michelle:7
Campbell,Michelle:5
Raj,Joy:1

所以我们所有的都在下面的一行代码中,如下所示:

首先我们将文本分成两行('\ n \ n')并将其放入l

l=s.split('\n\n') 
>>> l
['Raj,Joy:9,8,1', 'Smith,John:8', 'Campbell,Michelle:5,7,9']

然后你需要创建一个包含名称和分数的对列表:

>>> [[(i[0],j) for j in i[1].split(',')] for i in [i.split(':') for i in l]]
[[('Raj,Joy', '9'), ('Raj,Joy', '8'), ('Raj,Joy', '1')], [('Smith,John', '8')], [('Campbell,Michelle', '5'), ('Campbell,Michelle', '7'), ('Campbell,Michelle', '9')]]

最后你需要首先链接嵌套列表,然后根据带有排序函数的第二个元素(得分)和以下键对该列表进行排序:

key=lambda x: x[1]

如果你想写入文件:

with open ('sample_file','w') as f :
     for i in sorted(chain(*[[(i[0],j) for j in i[1].split(',')] for i in [i.split(':') for i in l]]),key=lambda x: x[1],reverse=True) :
        f.write(':'.join(i))

答案 3 :(得分:0)

s = """Raj,Joy:9,8,1
Smith,John:8
Campbell,Michelle:5,7,9"""

使用getKey提供元组第二个元素作为sorted()

的键
def getKey(item):
    return item[1]

声明您的列表对象

asc_list = []
result = []

使用list comprehension将输入拆分为单独的行:

asc_list = [i for i in s.split("\n")]
asc_list = [(j.split(':')[0],k) for j in asc_list for k in j.split(':')[1].split(',')]

使用sorted对元组编号2进行排序

result =  sorted(asc_list_nums, key=getKey)

输出:

[('Raj,Joy', '1'), ('Campbell,Michelle', '5'), ('Campbell,Michelle', '7'), ('Raj,Joy', '8'), ('Smith,John', '8'), ('Raj,Joy', '9'), ('Campbell,Michelle', '9')]

答案 4 :(得分:0)

Python one-liner的完美示例。应用列表推导和内置sorted函数。

将组合列表展平为元组列表

scores = [(record, score) for record, scores in zip(fileRecord, fileScores) for score in scores]

按降序按分数对元组列表进行排序

from operator import itemgetter
sorted(scores, key=itemgetter(1), reverse=True)

问题解决了一行

sorted([(record, score) for record, scores in zip(fileRecord, fileScores) for score in scores], key=itemgetter(1), reverse=True)

有用的参考资料