用尖叫的青蛙提取Json数据

时间:2019-03-05 16:34:56

标签: json regex web-scraping seo

我正在使用Screaming Frog作为从URL生成的Json中提取数据的一种方式。 生成的Json就是这种形式:

{"ville":[{"codePostal":"13009","ville":"VAUFREGE","popin":"ouverturePopin","zoneLivraison":"1300913982","url":""},{"codePostal":"13009","ville":"LES BAUMETTES","popin":"ouverturePopin","zoneLivraison":"1300913989","url":""},{"codePostal":"13009","ville":"MARSEILLE 9EME ARRON","popin":"ouverturePopin","zoneLivraison":"1300913209","url":""}]}

我正在“自定义”>“尖叫青蛙”中的“提取”中使用此正则表达式作为提取“ codePostal”值的方法。

“ codePostal”:“。*?”

问题是它没有提取任何东西。 当我在regex101中测试我的正则表达式时,这似乎是正确的。

您对哪里出问题有任何线索吗? 谢谢。

致谢。

2 个答案:

答案 0 :(得分:0)

您是否尝试保存输出以了解ScreamingFrog看到的内容?没关系-不是在一开始-RegEx是否有效。

也就是说,别忘了SF是基于Java的工具,因此它是正则表达式使用的引擎,因此请确保您使用正确的方言测试正则表达式。

答案 1 :(得分:0)

您需要指定括在括号中的组提取器。例如,在您的示例中,您需要将 ("codePostal":".*?") 作为提取器。

此外,如果您只是想提取该值,则可以改用以下内容。 "codePostal":"(.*?)"