我有一个文件words.txt
,其中每一行都是一个单词,后跟一个TAB
,后跟一个整数(表示单词的频率)。我想生成一个新文件,其中只包含拼写正确的单词行。
使用cat words.txt | hunspell -1 -G > ok_words.txt
我可以获得正确单词列表,但我怎样才能包含每行的其余部分(即TAB
和数字)?
输入:
adwy 27
bird 10
cat 12
dog 42
erfgq 9
fish 2
期望的输出:
bird 10
cat 12
dog 42
fish 2
答案 0 :(得分:5)
最简单的方法是使用join
命令:
$ join words.txt ok_words.txt
bird 10
cat 12
dog 42
fish 2
或保留标签:
$ join -t $'\t' words.txt ok_words.txt
bird 10
cat 12
dog 42
fish 2