如果让我们说一个看起来是这样的话,是否可以分辨两个字符串:
“您好我是新用户你好吗” 和 “U77agh gh78ah92v192v 9181v 72b”
我想摆脱垃圾邮件发送者,但我不确定如何判断字符串是好还是坏。
感谢。
答案 0 :(得分:3)
我首先会使用验证码来检测用户的机器人。
然后,我会使用类似Google Translate API的内容来查看该字符串是否会转换为其他语言。如果它无法翻译字符串,它看起来会返回相同的字符串,如果字符串没有翻译成5种语言,那么肯定会有错误。你可以通过在单词中分割字符串来改进这一点,看看你是否没有得到“这看起来像一个很好的字符串但是U77agh gh78ah92v192v”如果所有或几乎所有单词都翻译那么你就是可能有一个干净的字符串。