我正在解析以下数据结构:
var teamFixtures = new WS.Panel(fixturesConfig);
teamFixtures.load([300, [[883762,1,'23-08-2014','17:00',300,'Atalanta',0,777,'Pisa',1,'2 : 0','1 : 0',1,0,'FT','2014/2015','Coppa Italia','1',60,108,5433,11361,'ICI','it','it',0,0,0]
,[883062,1,'16-08-2014','17:00',300,'Atalanta',0,267,'Chievo',0,'3 : 0','1 : 0',1,0,'FT','2014','Club Friendlies','1',57,247,4117,8489,'ICF','it','it',1,0,0]
,[875534,1,'09-08-2014','17:00',300,'Atalanta',0,1501,'Spezia',0,'2 : 0','1 : 0',1,0,'FT','2014','Club Friendlies','1',57,247,4117,8489,'ICF','it','it',1,0,0]
,[875542,1,'06-08-2014','17:00',300,'Atalanta',0,8183,'Feralpisalò',0,'1 : 0','0 : 0',1,0,'FT','2014','Club Friendlies','1',57,247,4117,8489,'ICF','it','it',1,0,0]
,[875541,1,'06-08-2014','15:00',300,'Atalanta',0,7587,'Renate',0,'1 : 0','0 : 0',1,0,'FT','2014','Club Friendlies','1',57,247,4117,8489,'ICF','it','it',1,0,0]
,[848157,1,'02-08-2014','19:30',300,'Atalanta',0,302,'Nantes',0,'*0 : 0','0 : 0',0,0,'PEN','2014','Club Friendlies','1',57,247,4117,8489,'ICF','it','fr',1,0,0]
], [[865781,4,'31-08-2014','17:00',300,'Atalanta',0,76,'Verona',0,'vs',,0,1,,'2014/2015','Serie A','-1',5,108,5441,11369,'ISA','it','it',0,1,0]
,[865791,4,'14-09-2014','14:00',78,'Cagliari',0,300,'Atalanta',0,'vs',,0,0,,'2014/2015','Serie A','-1',5,108,5441,11369,'ISA','it','it',0,1,0]
]]);
我正在使用以下正则表达式找到开始字符串模式,然后返回列表列表中的所有内容:
regex = re.compile('var teamFixtures \= new WS\.Panel\(fixturesConfig\); teamFixtures\.load\([\d+, \[\[.*?\]\]?\)?;', re.S)
这引发了错误:
raise error, v # invalid expression
sre_constants.error: unexpected end of regular expression
对我来说虽然看起来我已经转义了这个表达式中的所有特殊字符,所以我无法理解为什么我收到此消息。
有人能看到我在哪里错了吗?
由于
答案 0 :(得分:2)
你没有正确地逃避正则表达式 - 一个开口括号未转义。请记住,正则表达式需要一组转义符,而python字符串则需要另一组;如果您不想使用Python字符串转义,请使用原始字符串(r'')。
更有效的正则表达式可能是:
regex = re.compile(r'teamFixtures\.load\(\[\d+,\s*(\[\[.*?]\s*])]\);', re.S)
你需要逃离的特殊字符是.()[
; =
和;
对于正则表达式都不重要,实际上]
也不需要进行转义。如果此正则表达式匹配,则双列表可用match.group(1)
并且(将)可以使用json.loads
轻松加载到python中,只要它是正确的JSON。