我如何使用sed来分隔html文档的正文和其他部分?

时间:2016-02-15 22:58:33

标签: linux bash sed

我遇到Linux命令sed

时遇到问题

我有一个html文档,我想提取正文文本,然后将其复制到一个新文件中,我将用sed执行:

sed '^<body>(.*)<\body>$/p' source.html > bodyextracted

但它似乎无法正常工作

1 个答案:

答案 0 :(得分:1)

mongodb://<dbuser>:<dbpassword>@dsxxxxxx.mongolab.com:39674/heroku_xxxxxxxx

这将在sed -n '/<body>/,/<\/body>/p' source.html > bodyextracted 第一次出现<body>的下一次出现后输出。