使用HTML锚点替换关键字的正则表达式,避免使嵌套锚点生成

时间:2012-05-31 11:57:04

标签: java php html regex anchor

仅替换不在锚点内的关键字:

// replace
... keyword ...  -> ... <a href="url">keyword</a> ...

// not replace
...<a href=""> ... keyword ... </a>...  -> ...<a href=""> ... keyword ... </a>...

请提供合适的模式来完成此任务。

注意:我正在处理字符串类型变量,而不是HTML文档!


编辑:好的,好的。我将使用HTML解析器,谢谢!

1 个答案:

答案 0 :(得分:3)

正则表达式无法可靠地用于执行此类操作,因为HTML不是regular language。如果使用像JSoup这样的解析器将字符串变量处理成DOM,那么将结果序列化为字符串,就可以获得可靠的结果。