标签: html regex grep
我试图只获取body标签之间的内容 这是一个示例文件
<html> <head> <tite> Test1 </title> </head> <body> Hello World! </body> </html>
我试过
grep "\<body\>.*\<\/body\>" index.html
但它只返回任何内容(执行-v返回整个内容以确保其正确的文件)。
由于
答案 0 :(得分:4)
您不能将grep用于多行模式匹配。请改用awk:
grep
awk '/<body>/,/<\/body>/' index.html
将返回:
<body> Hello World! </body>