在Linq,HtmlAgilityPack中选择其特定子节点大小的节点

时间:2018-10-06 12:30:59

标签: c# linq xpath html-agility-pack

我正在尝试获取以下数据。

<html>
<body>
<tr class="udline">
    <th rowspan="2" class="noln">시간</th>
    <th rowspan="2">개인</th>
    <th rowspan="2">외국인</th>
    <th rowspan="2">기관계</th>
    <th colspan="6" class="eb">기관</th>
    <th rowspan="2">기타법인</th>
</tr>
<tr class="udline">
    <th class="sub">금융투자</th>
    <th class="sub">보험</th>
    <th class="sub">투신<br>(사모)</th>
    <th class="sub">은행</th>
    <th class="sub">기타금융기관</th>
    <th class="sub">연기금등</th>
</tr>
<tr>
    <td colspan="11" class="blank_07"></td>
</tr>
<!-- following are data -->
<tr>
    <td class="date2">18:01</td>
    <td class="rate_up3">2,024</td>
    <td class="rate_down3">-3,307</td>
    <td class="rate_up3">1,116</td>
    <td class="rate_up3">824</td>
    <td class="rate_down3">-16</td>
    <td class="rate_up3">764</td>
    <td class="rate_down3">-43</td>
    <td class="rate_down3">-5</td>
    <td class="rate_down3">-408</td>
    <td class="rate_up3">166</td>
</tr>
<tr>
    <td class="date2">18:00</td>
    <td class="rate_up3">2,022</td>
    <td class="rate_down3">-3,305</td>
    <td class="rate_up3">1,116</td>
    <td class="rate_up3">824</td>
    <td class="rate_down3">-16</td>
    <td class="rate_up3">764</td>
    <td class="rate_down3">-43</td>
    <td class="rate_down3">-5</td>
    <td class="rate_down3">-408</td>
    <td class="rate_up3">166</td>
</tr>
...
</body></html>  

我想获取具有数据的“ tr”标签的节点列表。但是我在获取“ tr”标签时遇到问题。
我认为只要拥有11个td标签的“ tr”集就足够了。
所以我写下面的源代码。

result = await httpClient.GetStringAsync(new Uri(timeUrlAddress));
htmlDoc.LoadHtml(result);
var nodes = 
    htmlDoc.DocumentNode.SelectNodes("//tr")
    .Where(i => i.ChildNodes.Any(j => j.Name.Equals("td")).Count>10); // <--- I have Problem.

foreach(var i in nodes) {  ... } // <-- iterating list of <tr> tags.

而且不起作用。
我可以使用 DoucmentNode.SelectNodes(“ // tr”) ...来获取tr标签列表,然后附加 .Where(i => i.ChildNodes.Count> 10)得到我想要的。
但是tr有几个“ text” childNodes,我得到了不需要的节点。下图显示我使用.Where(i => i.ChildNodes.Count> 10)。

enter image description here

我想将具有td标签的tr节点作为子节点,并且正好具有11个td标签。
如何使用Linq语法获取tr节点?

1 个答案:

答案 0 :(得分:1)

如果您希望tr节点有大约11个td子级,则可以在XPath下使用:

//tr[count(td) = 11]