如何获取描述列表的值,在DOMXPath中使用术语和描述?

时间:2016-11-28 09:36:15

标签: curl web web-scraping web-crawler domxpath

到目前为止,我现在获得完整的页面html,我想从该页面获取描述列表的数据。我是网络报废的新手,所以请帮我解决这个问题?

这是我想要的HTML。

<dl id="specs">

    <dt class="section">Keyboard</dt>
    <dt>Keyboard</dt>
    <dd>88 keys</dd>
    <dt>Touch Sensitivity</dt>
    <dd>Key Touch: 5 types, fixed touch</dd>
    <dt>Keyboard Mode</dt>

    <dt class="section">Sound Generator</dt>
    <dt>Piano Sound</dt>
    <dd>SuperNATURAL Piano Sound</dd>

</dl>

1 个答案:

答案 0 :(得分:1)

你试过吗

/dl[id='specs']/dt[class='section']/(dt|dd)/text()

/dl[id='specs']/dt[class='section']/dt/text()
/dl[id='specs']/dt[class='section']/dd/text()

第一个应该为你提供dt和dd标签下的所有文本节点,而后者为dt和dd节点提供单独的文本节点,如果它应该具有任何意义。