从WebBrowserControl中单击的HtmlElement获取XPath

时间:2013-12-23 02:43:49

标签: c# xpath webbrowser-control

如何从WebBrowserControl中单击的HtmlElement获取XPath?

这是我检索点击的HtmlElement的方法:

System.Windows.Forms.HtmlDocument document = this.webBrowser1.Document;
document.MouseUp += new HtmlElementEventHandler(this.htmlDocument_Click);

private void htmlDocument_Click(object sender, HtmlElementEventArgs e)
{
    HtmlElement element = this.webBrowser1.Document.GetElementFromPoint(e.ClientMousePosition);
}

我想点击网站上的特定元素(价格,商品编号,描述等)并获取他们的XPath表达式。

谢谢!

1 个答案:

答案 0 :(得分:10)

XPath表达式不是HTML的标准功能(与XML不同)。如果您希望获得一个稍后可以与Html Agility Pack一起使用的元素XPath,则至少有两个选项:

  1. 使用HtmlElement.Parent向上走元素的DOM祖先树并构造 手动使用XPath。

  2. 使用Html Agility Pack本身并执行此类操作(未经测试):

  3. HtmlElement element = this.webBrowser1.Document.GetElementFromPoint(e.ClientMousePosition);
    
    var savedId = element.Id;
    var uniqueId = Guid.NewGuid().ToString();
    element.Id = uniqueId;
    
    var doc = new HtmlAgilityPack.HtmlDocument();
    doc.LoadHtml(element.Document.GetElementsByTagName("html")[0].OuterHtml);
    element.Id = savedId;
    
    var node = doc.GetElementbyId(uniqueId);
    var xpath = node.XPath;