正则表达式匹配字符的变化

时间:2018-01-09 03:22:35

标签: regex char character variation

所以人们正在使用这样的字符变体:
(有100多个这些,哈哈)
⌀⟴øoΘθ0ºööó֎
垃圾邮件种族主义/不允许的事情。

我使用正则表达式来对抗这些事情,但是我无法对抗所有这些不同的变体 我有什么可以做的吗?

可能是这些字符变体的预制列表,还是其他方式?

感谢任何帮助,
感谢。

1 个答案:

答案 0 :(得分:0)

您可以使用白名单,而不是黑名单,只允许使用a-z,A-Z和0-9之间的字符,以及特殊字符,例如。^ - ?! ([a-zA-Z0-9.,;!*?\-^]+)

在以下位置查看匹配示例:http://rubular.com/r/sUiLj2e1R1