如果文件包含多个列,请用逗号分隔,如下所示:
aaa,1,4,4,5,7
bbb,1,4,9,1,2
'sort -t,-k1 file.txt'和'sort -t,-k1,1 file.txt'之间有区别吗? 虽然上面的例子没有区别,但在我的一些项目案例中,它 确实有区别,但差异反映在我使用排序文件加入的情况下,并且join命令抛出'join:file 2不按排序顺序'的异常(那时,我使用'sort - t,-k1 file.txt')。后来我使用'sort -t,-k1,1 file.txt',然后join命令工作正常。谁能告诉我为什么?
答案 0 :(得分:2)
第二个数字是排序键结束的位置,默认为行尾。从联机帮助页:
<强>
-k, --key=POS1[,POS2]:
强>
start a key at POS1 (origin 1), end it at POS2 (default end of line)
所以,是的,存在差异。不属于您的数据,因为1,1
排序键没有重复项。
但是在指定1,1
排序键的地方,有两行:
abc,plugh
abc,xyzzy
可以按 顺序排序。仅使用1
(意为1,end-of-line
),它们将按照给定的顺序排序。
答案 1 :(得分:2)
sort -k1
表示从键1开始直到行尾。 sort -k1,1
表示从键1到键1的排序(因此只有第一个键)。在我的机器上,如果我使用-s
指定稳定排序,则两者会有所不同:
~ $ cat test.txt
aaa,1,4,4,5,7
aaa,1,3,9,1,2
~ $ sort -t, -k1 -s test.txt
aaa,1,3,9,1,2
aaa,1,4,4,5,7
~ $ sort -t, -k1,1 -s test.txt
aaa,1,4,4,5,7
aaa,1,3,9,1,2