如何使用正则表达式提取javascript变量

时间:2013-07-25 12:08:43

标签: javascript python regex

我需要使用python脚本(2.7)从远程页面提取包含多行JSON的javascript变量,我想使用正则表达式执行此操作,但我的模式不返回任何内容

我做错了什么?

这是我的代码:

request = urllib2.Request("http://somesite.com/affiliates/")
result = urllib2.urlopen(request)
affiliates = re.findall('#var affiliates = (.*?);\s*$#m', result.read())
print affiliates

1 个答案:

答案 0 :(得分:2)

如果您查看re.findall(pattern, string, flags=0)的文档,您会发现需要更改使用方式

affiliates = re.findall('var affiliates = (.*?);\s*$', result.read(), re.M)

您可能还想考虑 JavaScript 中的空格是如何草率的。