如何查找以句点结尾的所有单词?

时间:2012-05-15 08:12:21

标签: bash sed

我有一个包含许多以.结尾的单词的文件,其中大部分都是缩写,例如:

  • P.S。

如何输出一个只显示所有这些单词的列表?

  • 所有单词之前都有空格,因此可以使用此空格来查找单词的开头。
  • 没有任何字出现在行的开头。
  • 文件中没有句子,因此句号都以这种方式使用。

3 个答案:

答案 0 :(得分:3)

其中一种方法是:

egrep -o '\b[^ ]+\.' < list_of_words | sort | uniq

答案 1 :(得分:2)

如果你有GNU grep,请利用与Perl兼容的正则表达式:grep -Po '\S*\.(?=$|\s)'

答案 2 :(得分:1)

你可以这样做:

egrep -io ' [a-z.]+\.' input_file | sort -u