我有一个txt文件,其中包含以下方式的数据:
23 1 65 15 19.2
19 2 66 25 25.7
10 3 67 35 16.5
100 4 68 45 10.4
20 5 69 55 6.8
201 6 64 65 9.2
在文件中,使用\ t将每个值与其他值分开,然后使用\ n作为下一行。
我想根据每行的第一个值对此文件进行排序。 我的预期输出是:
10 3 67 35 16.5
19 2 66 25 25.7
20 5 69 55 6.8
23 1 65 15 19.2
100 4 68 45 10.4
201 6 64 65 9.2
但我得到的实际输出是:
10 3 67 35 16.5
100 4 68 45 10.4
19 2 66 25 25.7
20 5 69 55 6.8
201 6 64 65 9.2
23 1 65 15 19.2
它将值作为字符串,因此不将整数值作为整数。 我试过解析,但它不起作用。
我的代码:
with open('filename.txt') as fin:
lines = [line.split() for line in fin]
lines.sort(key=itemgetter(0),reverse=True)
with open('newfile.txt', 'w') as fout:
for i in lines:
fout.write('{0}\t\t\t\t\n'.format('\t\t\t '.join(i)))
请尽可能帮助。
答案 0 :(得分:10)
您目前正在比较字符串,您需要比较整数:
lines.sort(key=lambda x:int(x[0]), reverse=True)
字符串按字典顺序进行比较,因此:
>>> '2' > '100'
True
转换为int
可解决此问题:
>>> int('2') > int('100')
False
答案 1 :(得分:2)
另请查看pandas,如果您以后进行更复杂的操作,例如:
import pandas as pd
pd.read_table('filename.txt', header=None)\
.sort(columns=0)\
.to_csv('newfile.txt', sep='\t', header=None, index=False)