怎么不忽视" ' s"在一行文字中

时间:2018-03-18 19:45:29

标签: bash shell unix command-line

我有一个包含以下内容的文本文件:

the dog's

我想打印此文件的唯一字词,其应如下所示:

1 the
1 dog's

但是我写的这个命令,对待" ' s"作为一个新词

cat simple2.txt | tr -cs '[:alnum:]' '[\n*]' |sort| uniq -c| sort -nr|head -10     

上面的代码给出了错误的输出,如下所示

 1 The
 1 s
 1 dog

1 个答案:

答案 0 :(得分:3)

要将'视为单词的一部分,请将'添加到要翻译的字符类中:

tr -cs '[:alnum:]'\' '\n'

正如@Gilles在评论中指出的那样,您可以使用[\n*]替换\n