排序文本文件中的行,但只使用前N个字符

时间:2010-02-18 15:44:13

标签: python datetime sorting

我有一个包含这样的行的文本文件:

2010-02-18 11:46:46.1287 bla
2010-02-18 11:46:46.1333 foo
2010-02-18 11:46:46.1333 bar
2010-02-18 11:46:46.1467 bla

一个简单的排序会交换第2行和第3行(bar在foo之前),但我想保留原始顺序的行(具有相同的日期/时间)。

我怎样才能在Python中执行此操作?

奖金问题:GNU排序也可以这样做吗?

2 个答案:

答案 0 :(得分:24)

sorted(array, key=lambda x:x[:24])

示例:

>>> a = ["wxyz", "abce", "abcd", "bcde"]
>>> sorted(a)
['abcd', 'abce', 'bcde', 'wxyz']
>>> sorted(a, key=lambda x:x[:3])
['abce', 'abcd', 'bcde', 'wxyz']

答案 1 :(得分:5)

内置排序是稳定的,因此默认情况下,有效相等的值保持有序。

import operator

with open('filename', 'r') as f:
    sorted_lines = sorted(f, key=operator.itemgetter(slice(0, 24)))

此时sorted_lines将是已排序行的列表。要替换旧文件,请创建一个新文件,调用new_file.writelines(sorted_lines),然后将新文件移到旧文件上。