'sort -k1 file.txt'和'sort -k1,1 file.txt'有什么区别?

时间:2012-04-03 02:54:34

标签: sorting join

如果文件包含多个列,请用逗号分隔,如下所示:

aaa,1,4,4,5,7
bbb,1,4,9,1,2

'sort -t,-k1 file.txt'和'sort -t,-k1,1 file.txt'之间有区别吗? 虽然上面的例子没有区别,但在我的一些项目案例中,它 确实有区别,但差异反映在我使用排序文件加入的情况下,并且join命令抛出'join:file 2不按排序顺序'的异常(那时,我使用'sort - t,-k1 file.txt')。后来我使用'sort -t,-k1,1 file.txt',然后join命令工作正常。谁能告诉我为什么?

2 个答案:

答案 0 :(得分:2)

第二个数字是排序键结束的位置,默认为行尾。从联机帮助页:

  

<强> -k, --key=POS1[,POS2]:
  start a key at POS1 (origin 1), end it at POS2 (default end of line)

所以,是的,存在差异。不属于您的数据,因为1,1排序键没有重复项。

但是在指定1,1排序键的地方,有两行:

abc,plugh
abc,xyzzy

可以按 顺序排序。仅使用1(意为1,end-of-line),它们将按照给定的顺序排序。

答案 1 :(得分:2)

sort -k1表示从键1开始直到行尾。 sort -k1,1表示从键1到键1的排序(因此只有第一个键)。在我的机器上,如果我使用-s指定稳定排序,则两者会有所不同:

~ $ cat test.txt
aaa,1,4,4,5,7
aaa,1,3,9,1,2

~ $ sort -t, -k1 -s test.txt
aaa,1,3,9,1,2
aaa,1,4,4,5,7

~ $ sort -t, -k1,1 -s test.txt
aaa,1,4,4,5,7
aaa,1,3,9,1,2