我有一个包含以下内容的文本文件:
the dog's
我想打印此文件的唯一字词,其应如下所示:
1 the
1 dog's
但是我写的这个命令,对待" ' s"作为一个新词
cat simple2.txt | tr -cs '[:alnum:]' '[\n*]' |sort| uniq -c| sort -nr|head -10
上面的代码给出了错误的输出,如下所示
1 The
1 s
1 dog
答案 0 :(得分:3)
要将'
视为单词的一部分,请将'
添加到要翻译的字符类中:
tr -cs '[:alnum:]'\' '\n'
正如@Gilles在评论中指出的那样,您可以使用[\n*]
替换\n
。