我有两个文件,一个内容类似于以下内容:
1.something344343
2.something2dsdsf
4.somethingdsddfsd
5.something920j329
,第二个文件将是:
1.somethingwoimewoiew
3.something9jwe90jew
7.something90kjwe90ewk
本质上,第一个文件的编号行数多于第二个文件,第一个文件的行数大约为39,000行,而第二个文件的行数最多为23,000行。话虽如此,是否有人知道如何将第一个文件分成文件2中包含的行号(冒号前面的数字)和未包含在文件2中的行(这将在bash环境中)。最终的结果将是这样的:
lines included in second file:
1.something344343
lines not included in second file:
2.something2dsdsf
4.somethingdsddfsd
5.something920j329
我已经考虑过可以用来做这个的不同方法,但遗憾的是还没有能够提出任何有效的解决方案,如果有人可以帮助解决这个问题,虽然我真的很感激,谢谢!< / p>
答案 0 :(得分:5)
第二个文件中包含的行:
$ join -t"." -o 0,1.2 f1 f2
1.something344343
第二个文件中未包含的行:
$ join -t"." -v1 f1 f2
2.something2dsdsf
4.somethingdsddfsd
5.something920j329
答案 1 :(得分:1)
仅显示行号,而不是行内容:
$ diff --unchanged-group-format=$'Lines included in second file:\n%=' \
--old-group-format=$'Lines not included in second file:\n%<' \
--new-group-format='' \
<(awk -F. '{print $1}' file1) <(awk -F. '{print $1}' file2)
Lines included in second file:
1
Lines not included in second file:
2
4
5