Question

我正在使用c＃console app来获取xml文档。现在一旦加载了xmldocument，我想搜索特定的href标签：

href="/abc/def

在xml文档中。

一旦找到该节点，我想完全剥离标签，只显示Hello。

<a href="/abc/def">Hello</a>

我想我可以简单地使用正则表达式获取标签。但有人可以告诉我如何使用正则表达式完全删除href标签？

Answer 1

xml＆amp; html相同的区别：标记的内容。 xml的格式更严格。对于这个用例，我将使用转换和xpath查询重建文档。正如@Yahia所说，标记文档的正则表达式通常是一个坏主意。解析的正则表达式很复杂，无法作为通用解决方案。

Answer 2

用于类似任务的最流行的技术称为XPath。（它也是XQuery和XSLT的关键组件。）以下是否也可以解决您的任务？

root.SelectSingleNode("//a[@href='/abc/def']").InnerText = "Hello";

Answer 3

你可以尝试

string x = @"<?xml version='1.0'?> 
 <EXAMPLE>  
    <a href='/abc/def'>Hello</a> 
 </EXAMPLE>";

 System.Xml.XmlDocument doc = new XmlDocument();
 doc.LoadXml(x);
 XmlNode n = doc.SelectSingleNode("//a[@href='/abc/def']");
 XmlNode p = n.ParentNode;
 p.RemoveChild(n);
 System.Xml.XmlNode newNode = doc.CreateNode("element", "a", "");
 newNode.InnerXml = "Hello";
 p.AppendChild(newNode);

不确定这是否是你想要做的，但它应该足以让你朝着正确的方向前进。

使用正则表达式查找和替换xml文档中的文本

3 个答案: