C#检查字符串是否为句子

时间:2016-02-12 22:47:53

标签: c# filtering

基本上我想检查一个字符串是否是句子("你好,我是我!")或符号垃圾邮件(" HH ,,, {'&#39 ; {"),尽可能不使用符号数作为因子。现在它只是根据符号的计数器进行检测,但是当有人说出带有大量标点符号的东西时,就会被踢掉。

帮助?

1 个答案:

答案 0 :(得分:1)

如果文本中的符号数量不足,并且您不想使用太花哨(或购买)的东西,我建议您实施一个或多个其他步骤(增加难度):

  1. 计算字符串中所有A-Za-z和空格字符的数量,并将其与符号数量进行比较 - 所以如果他们写一个句子然后!!!!!!!!!!!! !最后,由于比例足够高,它仍然没有陷入困境。
  2. 如果仍然没有辨别力,请再次检查是否通过了第1项......

    1. 计算字符串中连续A-Za-z字符的数量 - 计算出这些“字词”的平均长度 - 如果平均值太短,则可能是垃圾邮件。
    2. 这些可以在RegEx中轻松完成 - 如果你想要更复杂,那么你必须使用其他人写的东西,这些东西有更多开发的统计方法(或者开始阅读超出我的词汇大学论文!)