grep删除头部标签

时间:2011-11-28 21:26:10

标签: html regex grep

我试图只获取body标签之间的内容 这是一个示例文件

<html>
<head>
<tite>
Test1 
</title>
</head>
<body> 
Hello World!
</body>
</html>

我试过

grep "\<body\>.*\<\/body\>" index.html

但它只返回任何内容(执行-v返回整个内容以确保其正确的文件)。

由于

1 个答案:

答案 0 :(得分:4)

您不能将grep用于多行模式匹配。请改用awk

awk '/<body>/,/<\/body>/' index.html

将返回:

<body>
Hello World!
</body>