循环遍历div类以获取一系列值

时间:2016-04-13 19:35:21

标签: c# html linq loops iteration

我有一个像你在下面看到的html,我如何循环遍历元素并获取强标记中的值,以及在a标记中的值,然后在结束的p-tag结束循环? 我想要得到的是:演员{Brian Keith,Brian K,B Keith}   `       

    类型:      冒险,                 家庭,                 戏剧
     

<p>
         <strong>Actor: </strong>
            <a title=" Brian Keith"> Brian Keith</a>, 
            <a title=" Tommy Kirk"> Tommy Kirk</a>, 
            <a title=" Kevin Corcoran "> Kevin Corcoran </a>                    
</p>

<p>
        <strong>Director: </strong>
            <a title="Norman Tokar">Norman Tokar</a>                    
            </p>

`

1 个答案:

答案 0 :(得分:1)

您已经知道可以使用HtmlAgilityPack。所以我会这样做:

var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(htmlstring);

var items = doc.DocumentNode.SelectNodes("//strong")
            .Select(x => new
            {
                Name = x.InnerText,
                Values = x.SelectNodes("../a").Select(a => a.InnerHtml).ToList()
            })
            .ToList();