Bash:比较两个文件并更改输出

时间:2014-07-09 07:04:09

标签: linux bash awk

尝试使用我的脚本修复输出内容,但不能正常工作。
我们将这两个文件命名为“文件A”& “档案B”
文件A是内容字符串,如:

C Test aa.test.com
D Test bb.example.com
G Test cc.try.example.com
K Test dd.test.com
M Test cc.ee.try.example.com
O Test .test.com
T Test gg-1-2.example.com
U Test hh.example.com
X Test example.com

文件B是:

test.com
example.com
try.example.com

尝试比较两个文件并输出如下:

C Test test.com
D Test example.com
G Test try.example.com
K Test test.com
M Test try.example.com
O Test test.com
T Test example.com
U Test example.com
X Test example.com

以下是我的示例代码:

#!/bin/bash
File_A="/root/temp/File_A"
File_B="/root/temp/File_B"

awk -v File_B="$File_B" -v OFS=" " '
BEGIN {
  while ( ( getline < File_B ) > 0 ){

     VAL = $0
     sub( /^[^ ]+ /, "", VAL )

     DICT[ $1 ] = VAL
  }
}
{
  print $0, DICT[ $1 ]

}' $File_A
exit

输出后我仍然得到与文件A相同的内容,但无法理解。

C Test aa.test.com 
D Test bb.example.com 
G Test cc.try.example.com 
K Test dd.test.com 
M Test cc.ee.try.example.com 
O Test .test.com 
T Test gg-1-2.example.com 
U Test hh.example.com 
X Test example.com 

或者可以通过其他命令实现?

3 个答案:

答案 0 :(得分:3)

你可以用这个:

grep -of file_B file_A | paste <(grep -f file_B file_A | cut -d' ' -f1,2 ) -

答案 1 :(得分:2)

按行长首先排序FILE_B并将其保存到FILE_C

cat FILE_B | awk '{ print length(), $0 }' | sort -nr  | cut -d ' ' -f 2- > FILE_C

然后运行此命令:

awk 'BEGIN{c=0;}FNR==NR{a[c++]=$0;next;} {for(i in a){if(match($3,a[i])){$3=a[i];print $0;next;} } }' FILE_C FILE_A

输出:

C Test test.com
D Test example.com
G Test try.example.com
K Test test.com
M Test try.example.com
O Test test.com
T Test example.com
U Test example.com
X Test example.com

答案 2 :(得分:1)

awk应该:

awk 'FNR==NR {arr[$0];next} {for (i in arr) {c=match($3,i);n=c&&(!b[$3]||c<b[$3])?i:n;b[$3]=c}$3=n}1' File-B File-A
C Test test.com
D Test example.com
G Test try.example.com
K Test test.com
M Test try.example.com
O Test test.com
T Test example.com
U Test example.com
X Test example.com