使用Python中的正则表达式替换基于上一文本行中的模式的文本行

时间:2018-07-09 12:27:56

标签: python regex

要求:基于上一行中的文本“ GVH:”,用新文本替换“ url:http://some.web.com/GVH-JBoss.ear”的文本行出现[例如:url:{{ 3}}。

示例: 考虑如下文本行: GVH: url: http://some.web.com/GVH-JBoss.ear sha1: 7b7b797735822d411c288d14510e9e023001d3ae VID: url: http://some.web.com/VID.ear sha1: 2fcac8bdcfadcfc12f0a7dfef0bad01db5f8f8a8

预期: GVH: url: ftp://new.web.com/new.ear sha1: 7b7b797735822d411c288d14510e9e023001d3ae VID: url: http://some.web.com/VID.ear sha1: 2fcac8bdcfadcfc12f0a7dfef0bad01db5f8f8a8

我尝试使用python regex [re.sub()方法]实现此目的:

re.sub(r'\s+GVH:[\s]*\s+url:\s\w+.*ear', 'url: ftp://new.web.com/new.ear', line.rstrip(), re.MULTILINE)

其他正则表达式试图匹配此指定的模式: 1. \s+GVH:[\s]*\s+url:\s\w+.*ear 2. (\s+GVH:\n)?\s*url:\s+\w+.*ear$ 3. (\s+GVH:\n)?\s*url:\s+\w+.*ear$ 4. [(?<=GVH:\s).*url:\s\w+.*ear$] 5. (?<=\sGVH:[\s\S])url: \w+.*ear 6. [\s]GVH:[\s\S](?=(\s+url: [\w]\.ear) 7. (^.*GVH:[\s]?$)|(^.*url:\s\w+.*ear$)

使用所有这些正则表达式,仅能找到任一行的文本,而不能找到两者。

所有人都无法捕获和替换这些文本行。

在这方面需要帮助。

2 个答案:

答案 0 :(得分:1)

print (re.sub(r'(GVH:\s+url:\s+).*?ear', r'\1ftp://new.web.com/new.ear', line))

   GVH:
     url: ftp://new.web.com/new.ear
     sha1: 7b7b797735822d411c288d14510e9e023001d3ae
   HVA:
     url:  http://some.web.com/HVA-JBoss.ear
     sha1: e3ec053c65af5ce134c469ebbe3d7da29995369f

答案 1 :(得分:1)

您可以使用yaml模块。

例如:

import yaml

with open(filename) as f:
    data = yaml.load(f)       #Read yml file

newVal = "ftp://new.web.com/new.ear"
data["GVH"]["url"] = newVal              #Update Value

with open(filename, 'w') as outfile:
    yaml.dump(data, outfile, default_flow_style=False)    #Write Back