如何使用xml解析html表?

时间:2011-10-27 05:05:47

标签: asp.net html xml

我有一个格式为

的html表
<table>
 <th>
     <td> td1 </td>
     <td> td2 </td>
     <td> td3 </td>
     <td> td4 </td>
     <td> td5 </td>
     <td> td6 </td>
     <td> td7 </td>
     <td> td8 </td>
     <td> td9 </td>
     <td> td10 <td>
   </th>
</table>

我需要解析表体内每行的单元格。我使用javascript循环遍历行,并且为了保存html内容我正在使用webmethod(因为在保存时,我的页面将重新加载,我将丢失我的html表,以避免我将它存储在使用webmethod的会话中在我的javascript调用中也发生了这种情况)。问题是我的客户端脚本有时会被跳过,我无法保存我的html内容。所以我想在一个脚本调用中将html内容作为一个整体发送,并在服务器端进行解析。

现在,我需要知道如何从服务器端解析它。 some-body可以帮我用xml解析它吗?

1 个答案:

答案 0 :(得分:4)

我认为你应该尝试HTML Agility Pack

来自CodePlex的

  

什么是Html Agility Pack(HAP)?

     

这是一个灵活的HTML解析器,可构建读/写DOM并支持   普通的XPATH或XSLT(你实际上并不需要理解XPATH或者   使用XSLT,不用担心......)。它是一个允许的.NET代码库   你解析“out of the web”HTML文件。解析器非常宽容   与“真实世界”格式错误的HTML。对象模型非常相似   什么提出System.Xml,但对于HTML文档(或流)。