我正在尝试使用来自
等网址的xPath提取地址https://www.americangemsociety.org/bradshaw-s-jewelers https://www.americangemsociety.org/fincher-ozment-jewelers
等
但问题是地址的位置在整个页面中并不统一。有些页面在段落节点#4上有地址,而有些页面在段落节点#2上有它们,依此类推。
我想知道我是否可以使用xPath根据Address的“强类”而不是特定节点来识别地址#
HTML
中的地址示例<p><strong class="">Address:</strong> 4355 Montgomery Hwy, Ste 2, Dothan, Alabama 36303-1696</p>
请建议
由于
答案 0 :(得分:1)
如果您使用//p[strong[not(normalize-space(@class)) and . = 'Address:']]
,则选择包含内容为p
的{{1}}元素的所有strong
元素。