标签: html parsing
我在解析一个html页面时遇到问题。 该页面的链接是http://www.symmetricom.com/resources/glossary/telecommunications-glossary/ 现在,如果我采用包含单词名称的强节点,它工作得很好但是如果我想采用节点br中包含的定义它不起作用。我使用html清理器来清理网页的代码。请帮助我,这非常重要
答案 0 :(得分:0)
说明文字位于<br>标记之外,<br>是换行符。你如何解析这个HTML,以及为什么要清理代码?
<br>