正则表达式解析问题,我正在为Drupal整合一个嵌入式视频提供程序模块。
对于基本视频页面,网址如下:http://v.ku6.com/show/EJEiKXHN1avFezNi.html所以此正则表达式可以解析视频代码:
'@ v.ku6.com /显示/([^“\&安培; /] +)。HTML @ I',
但是很多页面使用这种模式http://v.ku6.com/special/show_4086312/ZP0DCEnRVpK4BiEU.html所以我需要提取“ZP0DCEnRVpK4BiEU”,但在那里排除随机的4086312数字。
这是我到目前为止的正则表达式: '@ v.ku6.com / special / show_ [什么到这里?] /([^“\& /] +)。html @ i',
答案 0 :(得分:2)
what goes here?
:\d+
(数字)
答案 1 :(得分:1)
试试这个:
@v.ku6.com/special/show(?:_\d+)?/([^"\&/]+).html@i
(?:)
是非捕获组,?
之后表示它可以在那里,\d+
至少是一个数字