获取具有已知ID的div下的所有div并迭代它

时间:2014-05-15 21:10:22

标签: c# foreach html-agility-pack dom

我正在构建一个抓取OkCupid匹配的应用。他们的匹配结果包含看起来像这样的Html。

<div id="match_results">
    <div>person1</div>
    <div>person2</div>
    <div>person3</div>
</div>

我想在div foreach中执行match_results个人的div。但是,使用我的C#代码并不完全正确。 matchesList只包含一个元素(本身?而不是其中的所有div ...)

HtmlDocument matchesHtmlDoc = new HtmlDocument();
matchesHtmlDoc.LoadHtml(matches);

string matchResultDivId = "match_results";

// match results
HtmlNodeCollection matchesList = matchesHtmlDoc.DocumentNode.SelectNodes("//div[@id = '" + matchResultDivId + "']");

foreach (HtmlNode match in matchesList)
{
    //test
    Console.WriteLine(match.ToString());
}

1 个答案:

答案 0 :(得分:2)

您忘记选择子div:

HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(matches);

string matchResultDivId = "match_results";
string xpath = String.Format("//div[@id='{0}']/div", matchResultDivId);
var people = doc.DocumentNode.SelectNodes(xpath).Select(p => p.InnerText);

foreach(var person in people)
    Console.WriteLine(person);

输出:

person1
person2
person3