正则表达式,用于区分好词和坏词

时间:2013-03-13 16:03:30

标签: regex bash

我有一个坏词列表,如果在任何网络搜索引擎上使用它们就会被阻止。这些词的例子是:肛门,屁股,烧伤胸罩,臀部,暨,迪克,欲望,山雀。 因此,阻止包含任何这些先前单词作为其结构的一部分的正常单词。这些好词的例子有:模拟,运河,分析,资产,指南针,专辑,品牌,按钮,环境,迪克森,插图,重复。 我的问题:是否有一个正则表达式(或bash shell脚本),使我可以使用普通单词而不会因为列入黑名单的部分而被阻止? 感谢您的帮助。谢谢。

1 个答案:

答案 0 :(得分:4)

您可以使用\b,即“字边界”:

\bbutt\b

将匹配butt但不匹配button