如何根据另一个文件的内容对一个文件的内容进行排序

时间:2012-10-26 16:48:33

标签: file bash sorting debian

我有两个文件,一个内容类似于以下内容:

1.something344343
2.something2dsdsf
4.somethingdsddfsd
5.something920j329

,第二个文件将是:

1.somethingwoimewoiew
3.something9jwe90jew
7.something90kjwe90ewk

本质上,第一个文件的编号行数多于第二个文件,第一个文件的行数大约为39,000行,而第二个文件的行数最多为23,000行。话虽如此,是否有人知道如何将第一个文件分成文件2中包含的行号(冒号前面的数字)和未包含在文件2中的行(这将在bash环境中)。最终的结果将是这样的:

lines included in second file:
1.something344343

lines not included in second file:
2.something2dsdsf
4.somethingdsddfsd
5.something920j329

我已经考虑过可以用来做这个的不同方法,但遗憾的是还没有能够提出任何有效的解决方案,如果有人可以帮助解决这个问题,虽然我真的很感激,谢谢!< / p>

2 个答案:

答案 0 :(得分:5)

第二个文件中包含的行:

$ join -t"." -o 0,1.2 f1 f2
1.something344343

第二个文件中未包含的行:

$ join -t"." -v1 f1 f2
2.something2dsdsf
4.somethingdsddfsd
5.something920j329

答案 1 :(得分:1)

仅显示行号,而不是行内容:

$ diff --unchanged-group-format=$'Lines included in second file:\n%=' \
       --old-group-format=$'Lines not included in second file:\n%<' \
       --new-group-format='' \
       <(awk -F. '{print $1}' file1) <(awk -F. '{print $1}' file2)
Lines included in second file:
1
Lines not included in second file:
2
4
5