标签: regex pcre
我有一个将html转换为txt的正则表达式。 但它占用了大量的CPU用途。 我该如何优化呢?
((\n|\r){2,}) | (\r|\n)|<head.*?</head>|<script.*?</script> |<meta[^>]+>|<style.*?</style> | <[^>]*> |&[^\s]*;
答案 0 :(得分:1)
如果可以,请使用HTML解析器。由于各种原因,正则表达式对HTML不利,性能也将不可避免地受到影响。