。
。
示例:กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็ ็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้(或任何" zalgo"文本)
我还没有找到任何方法来检查这些。我制作了一种反垃圾邮件,而且我没有看到保留这些内容的必要性,因为它们可能会滞后于用户,而且通常只是垃圾邮件。
我想做的是
if (getMessage().getRawContent().contains(combined character).delete();
如果有人知道检查组合字符的简单方法,请发帖!
如果您对我的要求感到困惑,我可以进一步解释,并在需要时显示更多示例。
答案 0 :(得分:11)
有很多情况下,一个或两个连续的组合字符是完全有效的文本。我会寻找其中的四个或更多:
if (getMessage().getRawContent().matches(".*\\p{Mn}{4}.*"))