标签: regex html-parsing regex-lookarounds
如何以正则表达式格式捕获html ....中的所有代码?目前我尝试了几个代码,但它没有全部捕获,我试过这个
<body>([^*]*)<\/body>
但它没有捕获所有代码,因为一些javascript代码正在影响正则表达式命令。
你知道任何链接或样本来解决这个问题吗?
TIA
答案 0 :(得分:1)
使用此正则表达式
'#<body>(.*?)<\/body>#s'
答案 1 :(得分:1)
这可能会捕获标准<body>标记
<body>
(?:<body>((?s).*)<\/body>)
示例:http://regex101.com/r/iS4eE3