检索html层次结构中的元素

时间:2012-02-13 14:41:28

标签: c# html parsing watin

我有这段HT​​ML代码。我想使用WatiN在<div>标记内获取文本。 C#代码如下,但我确信它可以比我的解决方案更好地完成。有什么建议吗?

HTML:

<table id="someId" cellspacing="0" border="1" style="border-collapse:collapse;" rules="all">
    <tbody>
        <tr>
            <th scope="col">&nbsp;</th>
        </tr>
        <tr>
            <td>
                <div>Some text</div>
            </td>
        </tr>
    </tbody>
</table>

C#

// Get the table ElementContainer
IElementContainer diagnosisElementContainer = (IElementContainer)_control.GetElementById("someId");

// Get the tbody element
IElementContainer tbodyElementContainer = (IElementContainer)diagnosisElementContainer.ChildrenWithTag("tbody");

// Get the <tr> children
ElementCollection trElementContainer = tbodyElementContainer.ChildrenWithTag("tr");

// Get the <td> child of the last <tr>
IElementContainer tdElementContainer = (IElementContainer)trElementContainer.ElementAt<Element>(trElementContainer.Count - 1);

// Get the <div> element inside the <td>
Element divElement = tdElementContainer.Divs[0];

1 个答案:

答案 0 :(得分:1)

基于给定的,这样的东西就是我去IE的方式。

IE myIE = new IE();
myIE.GoTo("[theurl]");
string theText = myIE.Table("someId").Divs[0].Text;

以上是WatiN 2.1,Win7,IE9。