如何编写查找拼写错误的单词的UNIX脚本?

时间:2014-02-13 05:52:38

标签: unix

我正在尝试编写一个脚本,该脚本将搜索文本输入以查找拼写错误并使用grep打印错误字。我有一个文档,基本上包含一个名为english.txt的单词字典。我怎么能这样做?

1 个答案:

答案 0 :(得分:0)

我推荐使用aspell,但如果你这样做是为了学习,那么这是一个粗略的概念证明。

# cat all input, to support multiple input files
cat "$@" |
# Massage into one token per line, strip punctuation
tr -sc "-'A-Za-z0-9" '\n' |
# Print any tokens not in dictionary.txt
grep -vFf dictionary.txt

这是一项非常普遍的练习;快速的谷歌搜索应该带来一些例子,其中一些更复杂。