如何在sed可能多次出现的两个标记模式之间选择数据?

时间:2019-07-19 06:28:16

标签: sed

如何在sed可能多次出现的两个标记模式之间选择数据?

我在这里已经阅读了一些相关的主题,包括one,但我仍然对sed的复杂参数感到困惑。

我的数据是一些网页源代码,它们完全是乱七八糟的,没有成行。

例如:

123<div>abc</div><span>DEF</span><div>ghi</div>456

我需要获得如下输出,从第一个<div>到最后一个</div>,我该如何使用sed来做到这一点?:

<div>abc</div><span>DEF</span><div>ghi</div>

第二个问题:根据上述结果,如何获取数据<span>DEF</span>

非常感谢:)

1 个答案:

答案 0 :(得分:0)

对于您提供的特定示例,这是正则表达式:

<div>.*<\/div>

测试here