无法使用xpath提取数据

时间:2017-04-05 08:41:22

标签: xpath

我无法从下面粘贴的元素中提取地址。它是" br"标记,它为数据提取障碍。

<div class="secondary-attributes">
                    <span aria-hidden="true" data-hovercard-id="1" style="width: 18px; height: 18px;" class="icon icon--18-info icon--size-18 icon--currentColor yloca-info">
    <svg class="icon_svg">
        <use xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="#18x18_info"></use>
    </svg>
</span>

                                <span class="neighborhood-str-list">
            Nob Hill        </span>

                <address>
        700 Bush St<br>San Francisco, CA 94108
    </address>



    <span class="offscreen">Phone number</span>
    <span class="biz-phone">
        (415) 391-5008
    </span>

            </div>

我尝试XPath喜欢:

//div[@class="secondary-attributes"]/@address

1 个答案:

答案 0 :(得分:1)

使用//div[@class="secondary-attributes"]/@address,当您需要获取文字内容时,您正试图从address获取属性 div address 子元素

//div[@class="secondary-attributes"]/address/text()

如果您需要单独提取"700 Bush St""San Francisco, CA 94108",则可能需要指定索引:

//div[@class="secondary-attributes"]/address/text()[1]

代表"700 Bush St"

//div[@class="secondary-attributes"]/address/text()[2]

代表"San Francisco, CA 94108"