解析html页面的问题

时间:2011-02-21 10:11:34

标签: html parsing

我在解析一个html页面时遇到问题。 该页面的链接是http://www.symmetricom.com/resources/glossary/telecommunications-glossary/ 现在,如果我采用包含单词名称的强节点,它工作得很好但是如果我想采用节点br中包含的定义它不起作用。我使用html清理器来清理网页的代码。请帮助我,这非常重要

1 个答案:

答案 0 :(得分:0)

说明文字位于<br>标记之外,<br>是换行符。你如何解析这个HTML,以及为什么要清理代码?