在此网站上:http://www.yankeecandle.com/browse/candles/jar-candles/_/N-9yf
使用import.io从页面获取数据。
我正在寻找一个只获得最低价格的XPath,所以10.99和12.50。
我似乎不能在span中包含文本。
.//div[@class="prod-details"]/p[3]
让我全部付出代价
.//div[@class="prod-details"]/p[3][not(span)]
不仅忽略跨度文本,还忽略类中的文本=" sl-prce price"
所以问题是,我可以从屏幕截图," sale 12.50"而不是跨度中的24.99。
这可以在不使用Regex的情况下完成吗?
答案 0 :(得分:2)
试试这个XPath:
//div[@class="prod-details"]/p[3]/text()