正则表达式在import.io

时间:2015-10-07 15:40:00

标签: import.io

我正在试图弄清楚如何在import.io上使用正则表达式。我有一个HTML列,可以成功从网页上的链接中提取数据。我想在链接上提取部分查询字符串,所以我转到regexp字段并输入在regex101.com上成功测试的正则表达式。问题是,提取的数据根本不会改变。事实上,我可以在regexp字段中输入完整的乱码,它对提取的数据完全没有影响。我有点神秘。

如果我的正则表达式错误,提取的数据不应该变为空吗?使用正则表达式字段有一些技巧吗?我是否必须在xpath字段中输入内容?我点击View JSON按钮并在那里复制了该列的xpath并将其粘贴到手动xpath框中,但这也没有改变任何内容。

是否有关于如何使用regexp字段的教程?我不是在询问如何使用正则表达式,只是在import.io上使用它的接口。

1 个答案:

答案 0 :(得分:0)

格兰特,

你是对的。目前无法将regexp应用于HTML列。想法论坛中有一篇文章将此作为功能请求捕获,您可能想要对其进行投票,这样一来,如果想法得到建立,您也会收到通知:

http://support.import.io/forums/199278-ideas-forum/suggestions/6328279-apply-regular-expressions-to-html