好的,所以我还在学习命令行之类的东西,比如grep和diff以及它们在我的项目范围内的用途,但我似乎无法解决如何处理这个问题。
所以我有2个文件,每个文件包含数百个20个字符的长字符串。让我们调用文件A和B.我想通过A搜索,并使用B中的值作为键,找到A中但不在B中的UNIQUE字符串条目(这里有重复的唯一键是关键)
任何想法?
此外,我并不反对自己找到答案,但我对各种命令行脚本及其功能的理解还不足以真正开始考虑如何一起使用它们。
答案 0 :(得分:1)
查找comm
命令(POSIX comm
) 去做这个。另请参阅Unix command to find lines common in two files。
答案 1 :(得分:1)
有两种方法可以做到这一点。使用comm
或grep
,sort
和uniq
。
comm
comm afile bfile
comm
比较文件并输出3列,仅afile
中的行,bfile
中的行和共同的行。 -1
,-3
开关告诉comm
不打印这些列。
grep
sort
uniq
grep -F -v -file bfile afile | sort | uniq
或只是
grep -F -v -file bfile afile | sort -u
如果您的sort
处理-u
选项。
(注意:如果你的系统有命令fgrep
,则命令等同于grep -F
。)