Python异常文件排序

时间:2014-03-24 11:35:46

标签: python file sorting

我有一个txt文件,其中包含以下方式的数据:

23       1      65      15      19.2
19       2      66      25      25.7
10       3      67      35      16.5
100      4      68      45      10.4
20       5      69      55      6.8
201      6      64      65      9.2

在文件中,使用\ t将每个值与其他值分开,然后使用\ n作为下一行。

我想根据每行的第一个值对此文件进行排序。 我的预期输出是:

10       3      67      35      16.5
19       2      66      25      25.7
20       5      69      55      6.8
23       1      65      15      19.2
100      4      68      45      10.4
201      6      64      65      9.2

但我得到的实际输出是:

10       3      67      35      16.5
100      4      68      45      10.4
19       2      66      25      25.7
20       5      69      55      6.8
201      6      64      65      9.2
23       1      65      15      19.2

它将值作为字符串,因此不将整数值作为整数。 我试过解析,但它不起作用。

我的代码:

with open('filename.txt') as fin:
        lines = [line.split() for line in fin]
lines.sort(key=itemgetter(0),reverse=True)

with open('newfile.txt', 'w') as fout:
    for i in lines:
            fout.write('{0}\t\t\t\t\n'.format('\t\t\t '.join(i)))

请尽可能帮助。

2 个答案:

答案 0 :(得分:10)

您目前正在比较字符串,您需要比较整数:

lines.sort(key=lambda x:int(x[0]), reverse=True)

字符串按字典顺序进行比较,因此:

>>> '2' > '100'
True

转换为int可解决此问题:

>>> int('2') > int('100')
False

答案 1 :(得分:2)

另请查看pandas,如果您以后进行更复杂的操作,例如:

import pandas as pd

pd.read_table('filename.txt', header=None)\
            .sort(columns=0)\
            .to_csv('newfile.txt', sep='\t', header=None, index=False)