仅替换不在锚点内的关键字:
// replace
... keyword ... -> ... <a href="url">keyword</a> ...
// not replace
...<a href=""> ... keyword ... </a>... -> ...<a href=""> ... keyword ... </a>...
请提供合适的模式来完成此任务。
注意:我正在处理字符串类型变量,而不是HTML文档!
编辑:好的,好的。我将使用HTML解析器,谢谢!
答案 0 :(得分:3)
正则表达式无法可靠地用于执行此类操作,因为HTML不是regular language。如果使用像JSoup这样的解析器将字符串变量处理成DOM,那么将结果序列化为字符串,就可以获得可靠的结果。