我正在构建一个抓取OkCupid匹配的应用。他们的匹配结果包含看起来像这样的Html。
<div id="match_results">
<div>person1</div>
<div>person2</div>
<div>person3</div>
</div>
我想在div foreach
中执行match_results
个人的div。但是,使用我的C#代码并不完全正确。 matchesList
只包含一个元素(本身?而不是其中的所有div ...)
HtmlDocument matchesHtmlDoc = new HtmlDocument();
matchesHtmlDoc.LoadHtml(matches);
string matchResultDivId = "match_results";
// match results
HtmlNodeCollection matchesList = matchesHtmlDoc.DocumentNode.SelectNodes("//div[@id = '" + matchResultDivId + "']");
foreach (HtmlNode match in matchesList)
{
//test
Console.WriteLine(match.ToString());
}
答案 0 :(得分:2)
您忘记选择子div:
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(matches);
string matchResultDivId = "match_results";
string xpath = String.Format("//div[@id='{0}']/div", matchResultDivId);
var people = doc.DocumentNode.SelectNodes(xpath).Select(p => p.InnerText);
foreach(var person in people)
Console.WriteLine(person);
输出:
person1
person2
person3