为正则表达式预定义一些类似的字符

时间:2018-12-16 00:29:10

标签: php regex mediawiki

我在黑名单中有+1000个冒犯性单词,我想将它们与正则表达式匹配,以表示任何可能的字符。例如:

  • 单词kir
  • [ccĆćĈĉÇçČčĊċςСс] for
  • [ĶķΚκКкЌќ] for k
  • 为我准备的[lili]
  • r的[RrŔŕŖŗŘřforя]
  • o的[OoÓóÔòÔôÔôÖöÕõǑǒŌō0ŎŏǪ​​ǫŐőðØøδΘθΟοσΦφΩОоФфЮю]
  • 为你准备的[uuÚúÛûŨũǓǔǖǘǚǜŰűυUuÙùÜüŮůŪūŬŭŲųμЦцЧчЏџ]

解决方案:

  1. 用上面的代码替换每个字符会爆炸 regex语法

  2. -我知道我们可以通过这些代码对整个文本进行预清洗,但是我想知道是否有其他可能性可以通过正则表达式来完成?

语言为PHP,此正则表达式应在MediaWiki abuse filter处执行

0 个答案:

没有答案