从字符串中提取单词使用python正则表达式

时间:2014-07-22 10:45:36

标签: python regex

我想从字符串

中提取模型编号
/dev/sda:

ATA device, with non-removable media
    Model Number:       ST500DM002-1BD142                       
    Serial Number:      W2AQHKME
    Firmware Revision:  KC45    
    Transport:          Serial, SATA Rev 3.0

我写的正则表达式,

re.search("Model Number:(\s+[\w+^\w|d]\n\t*)", str)

但问题是,它不匹配字符串str

中的任何特殊字符(非ascii)

Python 2.6

注意:字符串可以是任意字符/数字(包括特殊字符)

的组合

1 个答案:

答案 0 :(得分:6)

你的正则表达式是,

Model Number:\s*([\w-]+)

Python代码将是,

>>> import re
>>> s = """
... 
... /dev/sda:
... 
... ATA device, with non-removable media
...     Model Number:       ST500DM002-1BD142                       
...     Serial Number:      W2AQHKME
...     Firmware Revision:  KC45    
...     Transport:          Serial, SATA Rev 3.0"""
>>> m = re.search(r'Model Number:\s*([^\n]+)', s)
>>> m.group(1)
'ST500DM002-1BD142'

<强>解释

  • Model Number:\s*匹配字符串Model Number:,后跟零个或多个空格。
  • ([^\n]+)一次或多次捕获任何字符,但不能捕获换行符。