Question

我是Python和正则表达式noob。我设法通过以下语句将完整页面的html源代码放入命令行。

print (driver.page_source).encode('utf-8')

冷却。但是在该文本中有一些可预测的字符串，我需要提取并存储到数组中。要查找的字符串模式是，[4个数字]后跟一个[连字符]，后跟1到5个数字，例如：

2013-80324或2013-03但不是2013-832888

感谢您的帮助。

Answer 1

(?:^|(?<=\D))\d{4}-\d{1,5}(?=\D|$)