正则表达式删除HTML数字代码

时间:2016-01-28 16:19:02

标签: regex

我想使用常规表达式删除特殊的HTML字符。

™是商标符号 - 可以留下来。

但如果&#;之间的数字长度大于4位数,则需要将其删除。

例如:😏是笑脸 - 需要过滤掉。

这行代码无效$article =~ s/&#\d{4,};//;

1 个答案:

答案 0 :(得分:2)

  • 使用 g lobal标志替换模式的所有实例,而不仅仅是第一个。
  • 如果您要替换大于 4位数的实例,请使用 5 进行量化。
$article =~ s/&#\d{5,};//g;