我有一个格式为
的html表<table>
<th>
<td> td1 </td>
<td> td2 </td>
<td> td3 </td>
<td> td4 </td>
<td> td5 </td>
<td> td6 </td>
<td> td7 </td>
<td> td8 </td>
<td> td9 </td>
<td> td10 <td>
</th>
</table>
我需要解析表体内每行的单元格。我使用javascript循环遍历行,并且为了保存html内容我正在使用webmethod(因为在保存时,我的页面将重新加载,我将丢失我的html表,以避免我将它存储在使用webmethod的会话中在我的javascript调用中也发生了这种情况)。问题是我的客户端脚本有时会被跳过,我无法保存我的html内容。所以我想在一个脚本调用中将html内容作为一个整体发送,并在服务器端进行解析。
现在,我需要知道如何从服务器端解析它。 some-body可以帮我用xml解析它吗?
答案 0 :(得分:4)
我认为你应该尝试HTML Agility Pack
来自CodePlex的
什么是Html Agility Pack(HAP)?
这是一个灵活的HTML解析器,可构建读/写DOM并支持 普通的XPATH或XSLT(你实际上并不需要理解XPATH或者 使用XSLT,不用担心......)。它是一个允许的.NET代码库 你解析“out of the web”HTML文件。解析器非常宽容 与“真实世界”格式错误的HTML。对象模型非常相似 什么提出System.Xml,但对于HTML文档(或流)。