使用HTMLagilitypack 5获取数据

时间:2014-12-08 10:44:31

标签: c# .net xpath html-agility-pack

我想使用HtmlAgilityPack从网站上获取一些数据。数据存储在具有属性class =" translateTxt"的对象中。我使用此代码,但它返回null

c#c​​ode:

HtmlAgilityPack.HtmlDocument doc = hw.Load(Url);
HtmlNodeCollection nodes1 = doc.DocumentNode.SelectNodes("//div[@class='translateTxt']");
        foreach (HtmlNode node in nodes1)
        {
            string Txt = node.InnerText;
        }

html代码:

<div id="trans" class="tap_mt">
    <div class="tr_brst clearfix">
        <div class="tr_instyle">
            <div class="tr_ext clearfix">
                <div class="translateTxt">
                    hi
                </div>
            </div>
        </div>
    </div>
</div>

1 个答案:

答案 0 :(得分:0)

尝试使用以下内容获取所有后代div标签的

 var findclasses = doc.DocumentNode.Descendants("div").Where(d => 
d.Attributes.Contains("class") && d.Attributes["class"].Value.Contains("translateTxt"));

然后循环遍历findClasses变量