我无法从下面粘贴的元素中提取地址。它是" br"标记,它为数据提取障碍。
<div class="secondary-attributes">
<span aria-hidden="true" data-hovercard-id="1" style="width: 18px; height: 18px;" class="icon icon--18-info icon--size-18 icon--currentColor yloca-info">
<svg class="icon_svg">
<use xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="#18x18_info"></use>
</svg>
</span>
<span class="neighborhood-str-list">
Nob Hill </span>
<address>
700 Bush St<br>San Francisco, CA 94108
</address>
<span class="offscreen">Phone number</span>
<span class="biz-phone">
(415) 391-5008
</span>
</div>
我尝试XPath
喜欢:
//div[@class="secondary-attributes"]/@address
答案 0 :(得分:1)
使用//div[@class="secondary-attributes"]/@address
,当您需要获取文字内容时,您正试图从address
获取属性 div
address
子元素:
//div[@class="secondary-attributes"]/address/text()
如果您需要单独提取"700 Bush St"
和"San Francisco, CA 94108"
,则可能需要指定索引:
//div[@class="secondary-attributes"]/address/text()[1]
代表"700 Bush St"
或
//div[@class="secondary-attributes"]/address/text()[2]
代表"San Francisco, CA 94108"