重新格式化文件名的Python3代码

时间:2018-05-09 20:37:22

标签: regex python-3.6 macos-sierra

# Regex pattern
filePattern = re.compile(r'''
    (#LPy3THW_Ex)
    (\d){1,3}
    (_macOS|_Windows)?
    (\.mp4)
    ''', re.VERBOSE)

我正在编写一个程序,应该将“LPy3THW_Ex6.mp4”简化为“ex6.mp4”。当我运行它时,下面是错误消息。我不确定问题是什么以及如何解决它。

Traceback (most recent call last):
  File "file_rename.py", line 13, in <module>
    ''', re.VERBOSE)
  File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/re.py", line 233, in compile
    return _compile(pattern, flags)
  File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/re.py", line 301, in _compile
    p = sre_compile.compile(pattern, flags)
  File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/sre_compile.py", line 562, in compile
    p = sre_parse.parse(p, flags)
  File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/sre_parse.py", line 855, in parse
    p = _parse_sub(source, pattern, flags & SRE_FLAG_VERBOSE, 0)
  File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/sre_parse.py", line 416, in _parse_sub
    not nested and not items))
  File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/sre_parse.py", line 768, in _parse
    source.tell() - start)
sre_constants.error: missing ), unterminated subpattern at position 2 (line 2, column 2)

1 个答案:

答案 0 :(得分:0)

当前错误是由#符号引起的,该符号在使用re.VERBOSE选项编译的正则表达式模式中启动内联注释。

你应该将它转义(如果#应该作为文字散列字符存在于字符串中)或者将其删除(如果在该上下文中字符串内不符合该符号)。另外,acc。对于示例输入/输出,您应该删除#并重新排列捕获组,可能类似于:

filePattern = re.compile(r'''^
    LPy3THW_
    (
      Ex\d{1,3}
      (?:_macOS|_Windows)?
      \.mp4
    )
    $''', re.VERBOSE)
print(filePattern.sub(r"\1", s).lower())
# => ex6.mp4

请注意,(\d){1,3}会创建重复捕获组,并仅存储组中的最后一位数字。我添加了锚点以匹配整个字符串,仅用于演示目的(因为我在这里使用re.sub)。

但是,您似乎可以将_分成两部分并获取最后一项:

s.split('_', 2)[-1].lower() # => ex6.mp4

请参阅Python demo