在linux中是否有办法找到当前文件夹和子文件中最重复的单词。 我需要这个来找到我项目中最常用的c ++类。 输出可能是这样的:
class alpha : 157,
class beta : 98,
class gamma : 13,
...
表示对类alpha等的157个引用......
可以使用Linux命令(也许是grep)来完成吗?或者我应该使用这个工具吗?
答案 0 :(得分:2)
要查找文件中最常用的单词,可以使用
grep -hoE "\w+" * | sort | uniq -c | sort -g
这会根据您的问题计算所有单词。
grep -hoE "\w{7,}" * | sort | uniq -c | sort -g
这会计算超过六个字符的单词。