我们正在使用JCaptcha作为我的团队正在编写的小应用程序中的验证码工具。然而,就在开发期间(在一个小团队 - 我们中的4个人),我们遇到了许多诅咒词和其他可能令人反感的词,用于实际的验证码。有没有办法过滤掉可能令人反感的词语,以便它们不会呈现给用户?
答案 0 :(得分:5)
我花时间下载JCaptcha并查看源代码。基本上JCatpcha的工作方式就像除ReCaptcha之外的每一个验证码。因此,你想要的是微不足道的。
JCaptcha正在使用WordGenerator的非常简单的概念,即界面:
public interface WordGenerator {
String getWord(Integer length);
String getWord(Integer length, Locale locale);
}
让我们忽略本地化。
典型用法是这样的:
WordGenerator words = ...
WordToImage word2image = new SimpleWordToImage();
ImageCaptchaFactory factory = new GimpyFactory(words, word2image);
pixCaptcha = factory.getImageCaptcha();
在他们的单元测试中,我们可以看到,出于测试目的:
WordGenerator words = new DummyWordGenerator("TESTING");
WordToImage word2image = new SimpleWordToImage();
ImageCaptchaFactory factory = new GimpyFactory(words, word2image);
pixCaptcha = factory.getImageCaptcha();
请注意,我们对使用的“WordGenerator”进行了整体控制。
这是我刚写的一个(工作的,功能齐全的)字生成器:
private static final Random r = new Random( System.currentTimeMillis() );
public String getWord( final Integer length ) {
final StringBuilder sb = new StringBuilder();
for (int i = 0; i < length; i++) {
final int rnd = r.nextInt( 52 );
final char c = (char) (rnd < 26 ? 'a' + rnd : 'A' + (rnd-26));
sb.append( c );
}
return sb.toString();
}
它生成如下随机“单词”:
fqXVxId
cdVWBSZ
zXeJFaY
aeoSeEb
OuBfzvL
unYewjG
EhbzRup
GkXkTyQ
yDGnHmh
mRFgHWM
FFBkTLF
DvCHIIT
fDmjqLH
XMWSOpa
muukLLN
jUedgYK
FlbWARe
WohMMgZ
lmeLHau
djHRqlc
请注意,如果您更喜欢“真实的单词”(例如reCaptcha,但reCaptcha使用真正的单词用于其他目的altogheter - 因为它有助于扫描/ OCRing书籍!)这不是问题,只需更改 getWord(。 ..)从字典中随机挑选单词。
现在你如何防止侮辱性的话被捡起来?这是琐碎的。在这里,我举一个例子(请不要争论代码,它实际上只是一个示例,显示可以完成):
private static final Set<String> s = new HashSet<String>();
static {
s.add( "f**k" );
s.add( "suck" );
s.add( "dick" );
}
private static final Random r = new Random( System.currentTimeMillis() );
public String getWord( Integer length ) {
String cand = getRandomWord( length );
while ( isSwearWord(cand) ) {
cand = getRandomWord( length );
}
return cand;
}
private boolean isSwearWord( final String w ) {
return s.contains( w.toLowerCase() );
}
public String getRandomWord( final Integer length ) {
final StringBuilder sb = new StringBuilder();
for (int i = 0; i < length; i++) {
final int rnd = r.nextInt( 52 );
final char c = (char) (rnd < 26 ? 'a' + rnd : 'A' + (rnd-26));
sb.append( c );
}
return sb.toString();
}
现在,如果你想防止发誓的话,你可能也想要阻止那些接近发誓的话(例如“fvck”和“dikk”< / em>等)。这又是微不足道的:
private boolean isSwearWord( final String w ) {
List<String> ls = generateAllPermutationsWithLevenhsteinEditDistanceOne(w);
for ( final String cand : ls ) {
if ( s.contains( cand.toLowerCase()) ) {
return true;
}
}
return false;
}
编写方法“generateAllPermutationsWithLevenhsteinEditDistanceOne(w)”留给读者作为练习。