Python,字符串,unicode字符

时间:2011-09-07 13:03:52

标签: python regex string unicode character

comp/INFO_MAP_ECE/101102.1.119

这个字符串是CPU的输出,但是在数字之后总是有特殊/不可打印的字符,我的目的是获得不包括前面的文本和后面的特殊/不可打印的数字。我正在尝试拆分方法但不知道如何使用特殊/不可打印的字符。任何人都可以建议吗?这将是一个很大的帮助。谢谢。

2 个答案:

答案 0 :(得分:3)

假设您的输出看起来与您展示的类似,您可以使用regular expression

numPattern = r'/([\d.]+)'
output = 'comp/INFO_MAP_ECE/101102.1.119'

m = re.search(numPattern, output)

if m: #If a match was found
  numString = m.group(1)  #Extracts the first group surrounded by ()
  #etc

此处的模式会查找/,然后查找一些数字和句点,然后搜索任何内容,并仅提取数字和句点。只要您始终获得与该描述匹配的字符串,这应该有效。

HTH!

答案 1 :(得分:1)

数字总是一样长吗?如果是这样,你可以切片。

'comp/INFO_MAP_ECE/101102.1.119'[18:30]