我正在试图弄清楚如何在import.io上使用正则表达式。我有一个HTML列,可以成功从网页上的链接中提取数据。我想在链接上提取部分查询字符串,所以我转到regexp字段并输入在regex101.com上成功测试的正则表达式。问题是,提取的数据根本不会改变。事实上,我可以在regexp字段中输入完整的乱码,它对提取的数据完全没有影响。我有点神秘。
如果我的正则表达式错误,提取的数据不应该变为空吗?使用正则表达式字段有一些技巧吗?我是否必须在xpath字段中输入内容?我点击View JSON按钮并在那里复制了该列的xpath并将其粘贴到手动xpath框中,但这也没有改变任何内容。
是否有关于如何使用regexp字段的教程?我不是在询问如何使用正则表达式,只是在import.io上使用它的接口。
答案 0 :(得分:0)
格兰特,
你是对的。目前无法将regexp应用于HTML列。想法论坛中有一篇文章将此作为功能请求捕获,您可能想要对其进行投票,这样一来,如果想法得到建立,您也会收到通知: