基本上我想检查一个字符串是否是句子("你好,我是我!")或符号垃圾邮件(" HH ,,, {'&#39 ; {"),尽可能不使用符号数作为因子。现在它只是根据符号的计数器进行检测,但是当有人说出带有大量标点符号的东西时,就会被踢掉。
帮助?
答案 0 :(得分:1)
如果文本中的符号数量不足,并且您不想使用太花哨(或购买)的东西,我建议您实施一个或多个其他步骤(增加难度):
如果仍然没有辨别力,请再次检查是否通过了第1项......
这些可以在RegEx中轻松完成 - 如果你想要更复杂,那么你必须使用其他人写的东西,这些东西有更多开发的统计方法(或者开始阅读超出我的词汇大学论文!)