使用AWK拆分HTML文件

时间:2013-03-24 19:01:22

标签: html awk

我想知道是否可以使用awk将HTML文件拆分为单独的.html文件?我想寻找模式:

<div class="post">

当它发现这为每个实例创建新文件时,我试图编译命令但是无法使其正常工作?我的文件名为working.html,这是我从我构建的命令中得到的。

awk '/<div class="post">/{x="F"++i;}{print > x;}' working.html

有什么想法吗?

1 个答案:

答案 0 :(得分:1)

看起来它正在轰炸,因为x未初始化,并且在首次在<div>行上设置之前无法用作文件名。

解决这个问题的一种方法是添加一个BEGIN模式来初始化它。

BEGIN {
  x = "F0"
}

/<div class="post">/ {
  x = "F" ++i
}

{ print > x }