正则表达式在代码注释中查找坏词

时间:2012-05-08 23:04:15

标签: java regex eclipse filter profanity

我们有一个大型应用程序(仅有40,000多条评论)我们将其移交给另一家公司,但需要确保我们的代码评论是犹太教的。我发现不适当的代码评论的计划如下...... 1 - 获取亵渎词的黑名单 2 - 在eclispe的代码搜索中使用正则表达式查看我们的应用程序中是否有任何这些单词,并手动检查每个案例。

对于第1项,我看过一些过滤的应用程序或网络服务,但是有人知道某个地方的简单单词列表吗?

对于第2项,如何在eclispe中搜索单词hamburger OR pizza?

3 个答案:

答案 0 :(得分:5)

为什么要使用Eclipse?

我只是建立一个“顽皮的单词”列表,并使用findgrep来搜索代码库中的事件。然后访问每个文件审查点击。 (您可以通过在每个标记文件的开头添加“FIXME”样式注释来自动化后者,并使用Eclipse的工作列表支持来浏览标记的文件。是否值得它取决于您拥有的命中数量看看。)

请记住,你会得到两个误报(取决于你是多么的狡猾)和假阴性......作者在不使用顽皮的话语的情况下说些冒犯性的东西。

答案 1 :(得分:1)

CodePro Analytix有一个名为“不恰当的语言”的静态代码分析检测器。您可以轻松地在其配置中添加更多顽皮的单词,然后在分布式团队或自动静态代码分析调查中使用它。

答案 2 :(得分:0)

对此的简单而正确的答案如下...... 在Eclipse中,您可以运行正则表达式来匹配单词,只需检查正则表达式按钮并将您的单词管理为披萨|汉堡包。