如何在Import.io中使用substring()?

时间:2015-04-14 20:02:04

标签: xpath import.io

我在XPath和import.io上遇到了一些问题,希望你能帮到我。 :)

html代码:

<a href="page.php?var=12345">

目前,我设法用以下方法提取href( page.php?var = 12345 )的内容:

./td[3]/a[1]/@href

虽然,我想收集: 12345

substring可能是解决方案,但它似乎不能用于import.io,因为我使用它...

substring(./td[3]/a[1]/@href,13)

关于问题是什么的任何想法?

提前多多谢谢!

2 个答案:

答案 0 :(得分:7)

尝试将此用于xpath :(将字段选为文本)

.//*[@class='oeil']/a/@href

然后将其用于正则表达式:

([^=]*)$

这将为您提供您正在寻找的ISBN号。

import.io仅在返回节点列表时支持XPath中的函数

答案 1 :(得分:1)

您的路径表达式很好,但也许应该是

substring(./td[3]/a[1]/@href,14)

&#34;似乎不起作用&#34;对错误的描述不是很清楚。你收到错误信息吗?输出错了吗?你有可以展示的路径表达式的代码吗?


您可以使用子字符串,但使用substring-after()会更好。

substring-after(/a/@href,'=')

假设输入了您显示的小片段:

<a href="page.php?var=12345"/>

将选择

12345

并考虑输入结构

substring-after(./td[3]/a[1]/@href,'=')

路径表达式中的前导.仅选择当前上下文节点的直接子td节点。我相信你知道你在做什么。