给定一个网页作为字符串,如何知道其ID的特定表的数据?

时间:2016-06-06 13:56:07

标签: c# html parsing web-scraping

我有一个网页HTML作为字符串。网页上有一张表格。我知道它的身份。我想从表中提取数据。在C#中这样做的最佳方法是什么?

例如(Bad indent)

<table cellspacing="0" rules="all" border="1" id="TABLE_ID" style="border-collapse:collapse;">
<tr>
    <th scope="col"> A </th><th scope="col"> B </th><th scope="col"> C </th><th scope="col"> D </th>
    <th scope="col"> E </th><th scope="col"> F </th><th scope="col"> G </th>
</tr>
<tr>
    <td>123456abc</td><td>john smith</td><td>01/12/2017</td><td>00/00/0000</td><td>&nbsp;</td><td>&nbsp;</td><td>RTA</td>
</tr>
<tr>
    <td>123456abc</td><td>john smith</td><td>01/12/2007</td><td>&nbsp;</td><td>&nbsp;</td><td>&nbsp;</td><td>RTA</td>
</tr>

我总是可以通过编写用于解析字符串的代码来实现它,但确实必须有更好的方法来实现这一点。

0 个答案:

没有答案