我得到了需要解析的HTML,我正在使用C#和Html Agility Pack Library来选择节点。我的html看起来像是:
<input data-translate-atrr-placeholder="FORGOT_PASSWORD.FORM.EMAIL">
或:
<h1 data-translate="FORGOT_PASSWORD.FORM.EMAIL"></h1>
其中data-translate-attr-****
是我需要找到的新属性模式
我可以使用这样的东西:
//[contains(@??,'data-translate-attr')]
但不幸的是,这只会搜索INSIDE属性的值。 如何使用通配符查找属性本身?
更新: @Mathias Muller
HtmlAgilityPack.HtmlDocument htmlDoc
// this is the old code (returns nodes)
var nodes = htmlDoc.DocumentNode.SelectNodes("//@data-translate");
// these suggestions return no nodes using the same data
var nodes = htmlDoc.DocumentNode.SelectNodes("//@*[contains(name(),'data-translate')]");
var nodes = htmlDoc.DocumentNode.SelectNodes("//@*[starts-with(name(),'data-translate')]");
更新2
这似乎是一个Html Agility Pack问题而不是XPath问题,我使用chrome来测试我的XPath表达式,所有以下工作都在chrome中但不在Html Agility Pack中:
//@*[contains(local-name(),'data-translate')]
//@*[starts-with(name(),'data-translate')]
//attribute::*[starts-with(local-name(.),'data-translate')]
我的解决方案
我最后只是用老式的方式做事......
var nodes = htmlDoc.DocumentNode.SelectNodes("//@*");
if (nodes != null) {
foreach (HtmlNode node in nodes) {
if (node.HasAttributes) {
foreach (HtmlAttribute attr in node.Attributes) {
if (attr.Name.StartsWith("data-translate")) {
// code in here to handle translation node
}
}
}
}
}
答案 0 :(得分:1)
使用XPath函数contains()
或starts-with()
。你需要像
//@*[contains(name(),'data-translate')]
或者
//@*[starts-with(name(),'data-translate')]
实际上检索属性节点。上面,@*
是您要查找的属性通配符。
答案 1 :(得分:1)
而不是使用name()
,请使用local-name()
,例如:
var nodes = htmlDoc.DocumentNode.SelectNodes("//@*[starts-with(local-name(),'data-translate')]");
不同之处在于name()
应该为您提供带有前缀的属性名称,例如xml中的命名空间,local-name()
将在那里发出该前缀,在您的情况下name()
并且local-name()
应该以相同的方式工作,因为它的html并没有命名空间,但似乎它们没有,它可能是一个bug。
测试:
var html = "<h3 x='foo'></h3>";
var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);
var ElementByName = doc.DocumentNode.SelectSingleNode("//*[name()='h3']"); //Works
var ElementByLocalName = doc.DocumentNode.SelectSingleNode("//*[local-name()='h3']"); //Works
var ElementByAttributeLocalName = doc.DocumentNode.SelectSingleNode("//*[@*[local-name()='x']]"); //Works
var ElementByAttributeName = doc.DocumentNode.SelectSingleNode("//*[@*[name()='x']]"); //Does NOT
//Mathias Way
var ElementByAttributeLocalName_ = doc.DocumentNode.SelectSingleNode("//@*[local-name() = 'x']"); //Works
var ElementByAttributeName_ = doc.DocumentNode.SelectSingleNode("//@*[name() = 'x']"); //Does NOT