Html Agility Pack循环表 - 根据以前的单元格值获取单元格值

时间:2017-07-13 21:31:36

标签: c# selenium-webdriver web-scraping phantomjs html-agility-pack

我有多个表,位置值以不同的索引顺序给出。 如果我循环遍历表格,如果前一个单元格字符串是“位置”,我怎样才能获得位置值。在下面的示例中,它是单元格[7],但在其他表上它将是9.如何在单元格内部文本为“位置”后有条件地获取值?基本上找到单元格“Location”获取下一个单元格的内部文本。

Html表:

<table class="tbfix FieldsTable"">
<tbody>
    <tr>
        <td class="name">Last Movement</td>
        <td class="value">Port Exit</td>
    </tr>
    <tr>
        <td class="name">Date</td>
        <td class="value">26/06/2017 00:00:00</td>
    </tr>
    <tr>
        <td class="name">From</td>
        <td class="value">HAMBURGE</td>
    </tr>
    <tr>
        <td class="name">Location</td>
        <td class="value">EUROGATE  HAMBURG</td>
    </tr>
    <tr>
        <td class="name">E/F</td>
        <td class="value">E</td>
    </tr>
</tbody>

Controller Loop Through:

foreach (var eachNode in driver.FindElements(By.XPath("//table[contains(descendant::*, 'Last Movement')]")))
                {
                    var cells = eachNode.FindElements(By.XPath(".//td"));
                    cd = new Detail();

                    for (int i = 0; i < cells.Count(); i++)
                    {
                        cd.ActionType = cells[1].Text.Trim();
                        string s = cells[3].Text.Trim();
                        DateTime dt = Convert.ToDateTime(s);
                        if (_minDate > dt) _minDate = dt;
                        cd.ActionDate = dt;

                    }
                }

2 个答案:

答案 0 :(得分:1)

在你的foreach循环中你可以使用它:

var location = eachNode.FindElement(By.XPath(".//td[contains(text(),'Location')]/following-sibling::td));

答案 1 :(得分:1)

假设您的数据总是这样构建,我会遍历所有标记并将数据添加到字典中。

尝试这样的事情:

underscore.js

您必须添加字典和结构的验证和检查,但这是一般的想法。