我正在使用import.io为newegg.com编写提取器。从列表页面获取价格值时,我面临一个困难。
<div class="item-price-now">
<span>from</span>
$
<strong>108</strong>
<sup>.00</sup>
</div>
价格包含在两个节点中,强和 sup 。我想将108.00作为一个节点。当我尝试使用Xpath时,我得到两个节点的值。
//div[@class="item-price-now"]//strong/text() | //div[@class="item-price-now"]//sup/text()
提前致谢。
答案 0 :(得分:2)
您可以使用xpath来获取div中的所有文本,然后使用正则表达式将其过滤到美元之后的文本。
xpath://div[@class='item-price-now']
- &gt; from $108.00
正则表达式:\$d+\.\d+
- &gt; $108.00