标签: regex
我想使用常规表达式删除特殊的HTML字符。
™是商标符号 - 可以留下来。
™
但如果&#和;之间的数字长度大于4位数,则需要将其删除。
&#
;
例如:😏是笑脸 - 需要过滤掉。
😏
这行代码无效$article =~ s/&#\d{4,};//;
$article =~ s/&#\d{4,};//;
答案 0 :(得分:2)
$article =~ s/&#\d{5,};//g;