Question

我正在试图找出如何计算每个单词出现的文件数量。例如，我有一个包含10个食谱文本的目录，我希望能够找到，例如，如何许多文本中“胡椒”这个词出现的结果就像'8胡椒'。

我知道如何计算字数等但是我觉得这有点过头了，我真的很感激一些帮助。

关于我所说的静脉的一个例子，这是我想出的字数统计命令

cat test.txt | tr '[A-Z]' '[a-z]' | tr -d '[:punct:]' | tr ' ' '\n' | sort | uniq

Answer 1

find -type f  \
  | xargs tr  -c '[:alpha:]' '\n' \
  | tr '[:upper]' '[:lower:]' \
  | sort \
  | uniq -c \
  | grep pepper

这个

您可能希望替换或改进 tr 命令，具体取决于您对文件的期望，或者限定 find 以仅匹配具有特定名称模板的文件等

Answer 2

考虑以下

 find <directory path>  -name "*pepper*" -type f  |wc -l

将列出所有有辣椒的文件并计算它们

其他替代方案（如果您位于收件人所在的目录中）

ls -l|grep -E '*pepper*'|wc -l

Answer 3

grep -l怎么样？例如，grep -l pepper *将列出包含＆＃34; pepper＆＃34;的所有文件。 grep -l pepper * | wc -l只会告诉你有多少这样的文件..