我需要使用python脚本(2.7)从远程页面提取包含多行JSON的javascript变量,我想使用正则表达式执行此操作,但我的模式不返回任何内容
我做错了什么?
这是我的代码:
request = urllib2.Request("http://somesite.com/affiliates/")
result = urllib2.urlopen(request)
affiliates = re.findall('#var affiliates = (.*?);\s*$#m', result.read())
print affiliates
答案 0 :(得分:2)
如果您查看re.findall(pattern, string, flags=0)
的文档,您会发现需要更改使用方式
affiliates = re.findall('var affiliates = (.*?);\s*$', result.read(), re.M)
您可能还想考虑 JavaScript 中的空格是如何草率的。