删除包含特定字符串的文本文件中的行

时间:2011-03-23 19:46:07

标签: shell sed text-parsing in-place

如何使用sed删除包含特定字符串的文本文件中的所有行?

19 个答案:

答案 0 :(得分:2362)

要删除该行并将输出打印到标准输出:

sed '/pattern to match/d' ./infile

直接修改文件:

sed -i '/pattern to match/d' ./infile

直接修改文件(并创建备份):

sed -i.bak '/pattern to match/d' ./infile

对于Mac OS X和FreeBSD用户:

sed -i '' '/pattern/d' ./infile

答案 1 :(得分:578)

除了sed之外,还有很多其他方法可以删除包含特定字符串的行:

AWK

awk '!/pattern/' file > temp && mv temp file

Ruby(1.9 +)

ruby -i.bak -ne 'print if not /test/' file

的Perl

perl -ni.bak -e "print unless /pattern/" file

Shell(bash 3.2及更高版本)

while read -r line
do
  [[ ! $line =~ pattern ]] && echo "$line"
done <file > o
mv o file

GNU grep

grep -v "pattern" file > temp && mv temp file

当然sed(打印逆转快于实际删除):

sed -n '/pattern/!p' file

答案 2 :(得分:217)

您可以使用sed替换文件中的行。但是,它似乎比使用grep将逆转换为第二个文件然后将第二个文件移动到原始文件上要慢得多。

e.g。

sed -i '/pattern/d' filename      

grep -v "pattern" filename > filename2; mv filename2 filename

无论如何,第一个命令在我的机器上花了3倍。

答案 3 :(得分:63)

使用GNU sed

的简单方法
sed --in-place '/some string here/d' yourfile

答案 4 :(得分:28)

您可以考虑使用ex(这是一个标准的基于Unix命令的编辑器):

ex +g/match/d -cwq file

其中:

  • +执行给定的Ex命令(man ex),与执行-c(写入和退出)的wq相同
  • g/match/d - 要删除给定match的行的Ex命令,请参阅:Power of g

以上示例是符合POSIX标准的方法,可根据此post at Unix.SEPOSIX specifications for ex就地编辑文件。

sed的区别在于:

  

sed S tream ED itor,而不是文件编辑器。 BashFAQ

除非你喜欢不可移植的代码,I / O开销和其他一些不好的副作用。所以基本上一些参数(例如就地/ -i)是非标准的FreeBSD扩展,可能在其他操作系统上不可用。

答案 5 :(得分:13)

我用一个包含大约345 000行的文件制作了一个小基准。在这种情况下,使用grep的方式似乎比sed方法快15倍。

我已尝试使用和不使用LC_ALL = C设置,但它似乎没有显着改变时间。搜索字符串(CDGA_00004.pdbqt.gz.tar)位于文件中间。

以下是命令和时间:

time sed -i "/CDGA_00004.pdbqt.gz.tar/d" /tmp/input.txt

real    0m0.711s
user    0m0.179s
sys     0m0.530s

time perl -ni -e 'print unless /CDGA_00004.pdbqt.gz.tar/' /tmp/input.txt

real    0m0.105s
user    0m0.088s
sys     0m0.016s

time (grep -v CDGA_00004.pdbqt.gz.tar /tmp/input.txt > /tmp/input.tmp; mv /tmp/input.tmp /tmp/input.txt )

real    0m0.046s
user    0m0.014s
sys     0m0.019s

答案 6 :(得分:13)

我在Mac上遇到了这个问题。另外,我需要使用变量替换来完成它。

所以我用过:

sed -i '' "/$pattern/d" $file

其中$file是需要删除的文件,$pattern是要删除的匹配模式。

我从此comment中选择了''

这里需要注意的是"/$pattern/d"中使用双引号。当我们使用单引号时,变量不会起作用。

答案 7 :(得分:12)

要使用grep获得类似于结果的内容,您可以执行以下操作:

echo "$(grep -v "pattern" filename)" >filename

答案 8 :(得分:11)

您也可以使用:

 grep -v 'pattern' filename

此处-v将仅打印您的模式以外的其他模式(即反转匹配)。

答案 9 :(得分:8)

答案 10 :(得分:2)

echo -e "/thing_to_delete\ndd\033:x\n" | vim file_to_edit.txt

答案 11 :(得分:2)

perl -i    -nle'/regexp/||print' file1 file2 file3
perl -i.bk -nle'/regexp/||print' file1 file2 file3

第一个命令编辑文件inplace(-i)。

第二个命令执行相同的操作,但通过将.bk添加到文件名(.bk可以更改为任何内容)来保留原始文件的副本或备份。

答案 12 :(得分:1)

cat filename | grep -v "pattern" > filename.1
mv filename.1 filename

答案 13 :(得分:1)

您还可以删除文件中的一系列行。 例如,删除SQL文件中的存储过程。

sed '/CREATE PROCEDURE.*/,/END ;/d' sqllines.sql

这将删除CREATE PROCEDURE和END;之间的所有行。

我已使用此sed命令清理了许多sql文件。

答案 14 :(得分:0)

如果有人想要为字符串的完全匹配做这件事,你可以使用grep -w中的-w标志来表示整体。也就是说,例如,如果要删除编号为11的行,但保留编号为111的行:

-bash-4.1$ head file
1
11
111

-bash-4.1$ grep -v "11" file
1

-bash-4.1$ grep -w -v "11" file
1
111

如果要一次排除多个确切模式,它也适用于-f标志。如果&#34;黑名单&#34;是一个文件,每行都有几个模式要删除&#34; file&#34;:

grep -w -v -f blacklist file

答案 15 :(得分:0)

在控制台中显示已处理的文本

cat filename | sed '/text to remove/d' 

将已处理的文本保存到文件中

cat filename | sed '/text to remove/d' > newfile

将处理过的文本信息附加到现有文件中

cat filename | sed '/text to remove/d' >> newfile

要处理已处理的文本,在这种情况下,请删除更多已删除内容的行

cat filename | sed '/text to remove/d' | sed '/remove this too/d' | more

| more将一次显示一页的文本。

答案 16 :(得分:0)

您可以使用较旧的ed来编辑文件,就像使用ex的{​​{3}}一样。在这种情况下,最大的区别是ed通过标准输入获取命令,而不是像ex那样使用命令行参数。在脚本中使用它时,通常的适应方法是使用printf将命令传递给它:

printf "%s\n" "g/pattern/d" w | ed -s filename

或带有Heredoc:

ed -s filename <<EOF
g/pattern/d
w
EOF

答案 17 :(得分:0)

奇怪的是,接受的答案实际上并没有直接回答问题。该问题询问有关使用sed替换 string 的问题,但答案似乎以关于如何将任意字符串转换为 regex 的知识为前提。

许多编程语言库都具有执行这种转换的功能,例如

python: re.escape(STRING)
ruby: Regexp.escape(STRING)
java:  Pattern.quote(STRING)

但是如何在命令行上做到呢?

由于这是一个面向sed的问题,一种方法是使用sed本身:

sed 's/\([\[/({.*+^$?]\)/\\\1/g'

因此,给定任意字符串$ STRING,我们可以编写如下内容:

re=$(sed 's/\([\[({.*+^$?]\)/\\\1/g' <<< "$STRING")
sed "/$re/d" FILE

或单线:

 sed "/$(sed 's/\([\[/({.*+^$?]\)/\\\1/g' <<< "$STRING")/d" 

具有此页面其他地方所述的变体。

答案 18 :(得分:0)

从所有匹配的文件中删除行

grep -rl 'text_to_search' . | xargs sed -i '/text_to_search/d'