Question

我有两个文件，一个内容类似于以下内容：

1.something344343
2.something2dsdsf
4.somethingdsddfsd
5.something920j329

，第二个文件将是：

1.somethingwoimewoiew
3.something9jwe90jew
7.something90kjwe90ewk

本质上，第一个文件的编号行数多于第二个文件，第一个文件的行数大约为39,000行，而第二个文件的行数最多为23,000行。话虽如此，是否有人知道如何将第一个文件分成文件2中包含的行号（冒号前面的数字）和未包含在文件2中的行（这将在bash环境中）。最终的结果将是这样的：

lines included in second file:
1.something344343

lines not included in second file:
2.something2dsdsf
4.somethingdsddfsd
5.something920j329

我已经考虑过可以用来做这个的不同方法，但遗憾的是还没有能够提出任何有效的解决方案，如果有人可以帮助解决这个问题，虽然我真的很感激，谢谢！< / p>

Answer 1

第二个文件中包含的行：

$ join -t"." -o 0,1.2 f1 f2
1.something344343

第二个文件中未包含的行：

$ join -t"." -v1 f1 f2
2.something2dsdsf
4.somethingdsddfsd
5.something920j329

Answer 2

仅显示行号，而不是行内容：

$ diff --unchanged-group-format=$'Lines included in second file:\n%=' \
       --old-group-format=$'Lines not included in second file:\n%<' \
       --new-group-format='' \
       <(awk -F. '{print $1}' file1) <(awk -F. '{print $1}' file2)
Lines included in second file:
1
Lines not included in second file:
2
4
5

如何根据另一个文件的内容对一个文件的内容进行排序

2 个答案: