我需要一个脚本或正则表达式(我将使用Javascript / jQuery来检查网站上的表单输入),以检查是否有人输入了大部分是乱码的单词。
正常的单词或句子应通过测试:
This is a normal sentence (pass)
Peterborough (pass)
这样的话应该不通过测试:
bfygrydyyisg (fail)
hjrrjmsjsinz (fail)
yqymuqawsioy (fail)
我想过连续使用大约6个辅音或元音的检查,但上面的最后一个例子仍然会通过,我知道像'节奏'这样的英语单词会失败(尽管不太可能需要) )。
有什么想法吗?谢谢!
答案 0 :(得分:1)
也许你可以使用像http://www.javascriptspellcheck.com/这样的拼写检查API,或者你可以参考John Resig的http://ejohn.org/blog/revised-javascript-dictionary-search/
答案 1 :(得分:1)
这种讨论可能会给你一些方向:Help on JS gibberish detection
答案 2 :(得分:1)
最近我遇到了同样的问题。基本上,我们需要确定表单字段是否包含乱码。我们希望快速检测到这种情况(以免减慢表单填充速度),并轻推用户以提供适当的答案。
有一些新的前端和后端库正在执行此检测。
希望这对其他人有帮助。