到目前为止,我现在获得完整的页面html,我想从该页面获取描述列表的数据。我是网络报废的新手,所以请帮我解决这个问题?
这是我想要的HTML。
<dl id="specs">
<dt class="section">Keyboard</dt>
<dt>Keyboard</dt>
<dd>88 keys</dd>
<dt>Touch Sensitivity</dt>
<dd>Key Touch: 5 types, fixed touch</dd>
<dt>Keyboard Mode</dt>
<dt class="section">Sound Generator</dt>
<dt>Piano Sound</dt>
<dd>SuperNATURAL Piano Sound</dd>
</dl>
答案 0 :(得分:1)
你试过吗
/dl[id='specs']/dt[class='section']/(dt|dd)/text()
或
/dl[id='specs']/dt[class='section']/dt/text()
/dl[id='specs']/dt[class='section']/dd/text()
第一个应该为你提供dt和dd标签下的所有文本节点,而后者为dt和dd节点提供单独的文本节点,如果它应该具有任何意义。