Question

在linux中是否有办法找到当前文件夹和子文件中最重复的单词。我需要这个来找到我项目中最常用的c ++类。输出可能是这样的：

class alpha : 157,
class beta  : 98,
class gamma : 13,
...

表示对类alpha等的157个引用......

可以使用Linux命令（也许是grep）来完成吗？或者我应该使用这个工具吗？

Answer 1

要查找文件中最常用的单词，可以使用

grep -hoE "\w+" * | sort | uniq -c | sort -g

这会根据您的问题计算所有单词。

grep -hoE "\w{7,}" * | sort | uniq -c | sort -g

这会计算超过六个字符的单词。