Question

我有一个文件words.txt，其中每一行都是一个单词，后跟一个TAB，后跟一个整数（表示单词的频率）。我想生成一个新文件，其中只包含拼写正确的单词行。

使用cat words.txt | hunspell -1 -G > ok_words.txt我可以获得正确单词列表，但我怎样才能包含每行的其余部分（即TAB和数字）？

输入：

adwy  27
bird  10
cat   12
dog   42
erfgq 9
fish  2

期望的输出：

bird  10
cat   12
dog   42
fish  2

Answer 1

最简单的方法是使用join命令：

$ join words.txt ok_words.txt 
bird 10
cat 12
dog 42
fish 2

或保留标签：

$ join -t $'\t' words.txt ok_words.txt 
bird    10
cat 12
dog 42
fish    2