标签: perl
我正在尝试自动从HTML文件中删除一些内容,并且我使用以下命令将所有内容剥离到有用数据:
perl -pi.bak -e 'undef $/; s/^.*?<pre>//s' $file
但是,出于某种原因,这会留下HTML文件的第一行(DOCTYPE声明)。
答案 0 :(得分:12)
到undef $/时,第一行已被阅读。在读取任何内容之前,使用-0选项设置$/。
undef $/
-0
$/
perl -p0i.bak -e 's/^.*?<pre>//s'