如何从WebBrowserControl中单击的HtmlElement获取XPath?
这是我检索点击的HtmlElement的方法:
System.Windows.Forms.HtmlDocument document = this.webBrowser1.Document;
document.MouseUp += new HtmlElementEventHandler(this.htmlDocument_Click);
private void htmlDocument_Click(object sender, HtmlElementEventArgs e)
{
HtmlElement element = this.webBrowser1.Document.GetElementFromPoint(e.ClientMousePosition);
}
我想点击网站上的特定元素(价格,商品编号,描述等)并获取他们的XPath表达式。
谢谢!
答案 0 :(得分:10)
XPath表达式不是HTML的标准功能(与XML不同)。如果您希望获得一个稍后可以与Html Agility Pack一起使用的元素XPath,则至少有两个选项:
使用HtmlElement.Parent
向上走元素的DOM祖先树并构造
手动使用XPath。
使用Html Agility Pack本身并执行此类操作(未经测试):
HtmlElement element = this.webBrowser1.Document.GetElementFromPoint(e.ClientMousePosition);
var savedId = element.Id;
var uniqueId = Guid.NewGuid().ToString();
element.Id = uniqueId;
var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(element.Document.GetElementsByTagName("html")[0].OuterHtml);
element.Id = savedId;
var node = doc.GetElementbyId(uniqueId);
var xpath = node.XPath;