标签: html xml xpath
我创建了一个方法,对于给定的url,将html转换为字符串。在内存中使用此字符串,我想找到具有某个data-XXX属性的所有img标记,提取它们的src属性然后更改它。
最干净的方法是什么?我已经尝试过XPathReader,但是当它在代码中找到注释时崩溃...任何其他XML解析器允许我查询某些属性而不必自己查看所有标记?
我也读过关于regexp的内容,但不知何故感觉不对。