使用变量的内容查找并替换两个占位符之间的所有内容

时间:2013-02-28 22:59:58

标签: python regex linux bash sed

阿罗哈, 我一直试图弄清楚如何在两个占位符之间替换/插入文本字符串。

#start
REPLACE ANYTHING IN HERE
#end

最初我试图通过sed用BASH做这个,但是当我试图将一个变量传递给sed时遇到了一个障碍。

sed -n -i '/#start/{p;:a;N;/#end/!ba;s/.*\n/hello\n/};p' file.txt

返回

#start
hello
#end

但是当我尝试

时没有快乐
sed -n -i '/#start/{p;:a;N;/#end/!ba;s/.*\n/$replace_var\n/};p' file.txt

sed -n -i "/#start/{p;:a;N;/#end/!ba;s/.*\n/$replace_var\n/};p" file.txt

我已经在这里工作了几个小时,并且已经四处寻找但没有找到解决方案。我要尝试使用python或其他语言,或者使用awk。我在这个领域有点新意,所以任何有用的信息都会受到赞赏。

提前致谢

这就是我最终选择的。 这是一个与cron一起使用最新发布的ssh阻止列表更新我的/var/etc/hosts.deny文件的脚本。

import re
import urllib2

hosts_deny = open('/etc/hosts.deny','r+')
hosts_deny_text = hosts_deny.read()

blockedHosts = urllib2.urlopen('http://www.openbl.org/lists/hosts.deny').read()
place = re.compile('(?<=#start)(\r?\n)'
                   '(.*?)'
                   '(?=\r?\n#end)',re.DOTALL)#DOTALL enables '.' to also include
                                             #a new line
hosts_deny_text = re.sub(place, '\n'+ blockedHosts, hosts_deny_text)
hosts_deny.seek(0)
hosts_deny.write(hosts_deny_text)
hosts_deny.close()

5 个答案:

答案 0 :(得分:3)

这似乎做你想要的:

sed -ie "/#start/,/#end/{/#start/b;/#end/b;s/.*/$replace_var/;}" file.txt

内部/#start/b/#end/b跳过这些行,否则您也会替换它们。

答案 1 :(得分:2)

鉴于你的解释,我只能提出这个简单的代码:

import re

ss = '''qslkjqskqsdhf
#start
REPLACE ANYTHING IN HERE
#end
2135468761265
'''

reg = re.compile('(?<=#start)(\r?\n)'
                 '(.*?)'
                 '(?=\r?\n#end)',re.DOTALL)

print ss
print '----'
print reg.sub('\\1Ia orana',ss)

结果

qslkjqskqsdhf
#start
REPLACE ANYTHING IN HERE
#end
2135468761265

----
qslkjqskqsdhf
#start
Ia orana
#end
2135468761265

答案 2 :(得分:0)

您可以将文件读入字符串然后执行:

sstart = s.split(start)
for i in range(len(s)):
   if i%2 ==1:
      send = sstart[i].split(end)
      for i in range(len(send)):
           if i%2 == 0:
                send[i] = REPLACEMENT
      sstart[i] = send.join()
s = sstart.join()

所以你基本上是在走完清单,切掉需要更换的部件,然后将部件粘合在一起。

答案 3 :(得分:0)

使用“dotall”正则表达式,这很容易。使用Perl,Python,PCRE等可以轻松实现这些功能。例如,在Python中:

>>> s = '''#start
... REPLACE ANYTHING IN HERE
... #end'''
>>> re.sub(r'(?s)(#start\n).*?\n(#end)',
           r'\1hello\n\2', s)
'#start\nhello\n#end'

显然匹配起始行和结束行并将它们替换为自己是过度的,但我决定保持它的一般性,以防你想进一步扩展它。

我使用(?s)而不是传递re.DOTALL标志,所以一切都是自包含的,你不必考虑Perl,Python等传递标志之间的区别。但在现实生活中,使用标志而不是嵌入它们通常更具可读性。

答案 4 :(得分:0)

我认为sed不适合这项任务,我会改用awk:

awk '!f; /#start/ { f=1; print repl } /#end/ { f=0; print }' repl="$replace_var" file.txt

f变量是一个标记,用于跟踪我们何时在标记内。 !f调用默认块({print $0})并打印标记之外的所有内容,包括#start标记。

测试

eyquem's answer复制的测试文件:

cat << EOF > file.txt
qslkjqskqsdhf
#start
REPLACE ANYTHING IN HERE
#end
2135468761265
EOF

将标记内容替换为hello\nhello

awk '!f; /#start/ { f=1; print repl } /#end/ { f=0; print }' repl="$(printf 'hello\nhello')" file.txt

输出:

qslkjqskqsdhf
#start
hello
hello
#end
2135468761265