用于mac的bash shell脚本从文件生成单词列表?

时间:2012-04-30 15:30:38

标签: macos bash shell

是否有在mac上运行的shell脚本从文本文件生成单词列表,列出了唯一的单词?如果可以按频率排序,那就更好了....

抱歉忘记提及,是的,我更喜欢打击,因为我现在正在使用mac ...

哦,我的文件是法语...(基本上我正在读一本小说并学习法语,所以我尝试生成一个单词列表帮助自己)。希望这不是问题?

3 个答案:

答案 0 :(得分:3)

如果我理解正确,你需要这样的东西:

cat <filename> | sed -e 's/ /\n/g' | sort | uniq -c

答案 1 :(得分:2)

此命令将执行

cat file.txt |  tr "\"' " '\n' | sort -u

此处sort -u无法在Macintosh计算机上运行。在这种情况下,请改用sort | uniq -c。 (感谢Hank Gay

cat file.txt |  tr "\"' " '\n' | sort | uniq -c 

答案 2 :(得分:1)

回答我的问题,点击我正在使用的最终版本:

tr -cs "[:alpha:]" "\n" < FileIn.txt | sort | uniq -c | awk '{print $2","$1}' >> FileOut.csv

一些注意事项:

  • tr可以直接用于替换。
  • 因为我有兴趣为我的法语词汇创建单词列表,所以我使用[:alpha:]
  • awk用于插入逗号,因此输出为csv文件,更容易上传...

再次感谢大家帮助我。

抱歉,我没有在开头明确说明我正在使用mac并期待一个bash脚本。

欢呼声。