我有以下字符串:
'10000 ABC = 1 DEF'
'1 AM = 0,30$'
'3500 ABC = 1 GTY'
'1000 HUYT=1ABC'
'1 MONET Data = 1 ABC'
我想找到一种灵活的方法从=
的左右两侧提取数值和字符串值。我不知道所有可能的字符串值。因此我无法预先定义它们。我唯一知道的是左右两边除以=
。
目标是为上面给出的例子得到这个结果:
String-pairs
:
ABC-DEF
AM-$
ABC-GTY
HUYT-ABC
MONET Data-ABC
Numeric-pairs
:
10000-1
1-0.30
3500-1
1000-1
1-1
我尝试使用.lstrip('...')
和rstrip("...")
,但它没有给我预期的结果。
答案 0 :(得分:3)
删除不需要的字符,并将=
替换为-
。
import re
str = ['10000 ABC = 1 DEF',
'1 AM = 0,30$',
'3500 ABC = 1 GTY',
'1000 HUYT=1ABC',
'1 MONET Data = 1 ABC']
String_pairs = []
Numeric_pairs = []
for s in str:
String_pairs.append (re.sub(r'\s*=\s*','-', re.sub(r'\s*\d+(,\d+)?\s*','', s)))
Numeric_pairs.append (re.sub(r'\s*=\s*','-', re.sub(r'\s*[^\d,=]+\s*','', s)))
print String_pairs
print Numeric_pairs
结果:
['ABC-DEF', 'AM-$', 'ABC-GTY', 'HUYT-ABC', 'MONET Data-ABC']
['10000-1', '1-0,30', '3500-1', '1000-1', '1-1']
或更酷的列表理解(具有相同的结果):
String_pairs = [re.sub(r'\s*=\s*','-', re.sub(r'\s*\d+(,\d+)?\s*','', s)) for s in str]
Numeric_pairs = [re.sub(r'\s*=\s*','-', re.sub(r'\s*[^\d,=]+\s*','', s)) for s in str]
答案 1 :(得分:1)
作为正则表达式的替代方法,您可以做的是遍历每个字符串并提取相关字符。它可能看起来与以下几行有关。
def extract_string_pairs(source_string):
string_pair = ''
for c in source_string:
if c.isalpha() or c == '$':
string_pair += c
elif c == '=':
string_pair += '-'
return string_pair
def extract_numeric_pairs(source_string):
string_pair = ''
for c in source_string:
if c.isdigit():
string_pair += c
elif c == '.':
string_pair += '.'
elif c == '=':
string_pair += '-'
return string_pair
答案 2 :(得分:0)
import re
str = ['10000 ABC = 1 DEF',
'1 AM = 0,30$',
'3500 ABC = 1 GTY',
'1000 HUYT=1ABC',
'1 MONET Data = 1 ABC']
def getThePat(pat):
for i in str:
i = i.split("=")
x = re.findall(pat, i[0])
y = re.findall(pat, i[1])
print(" ".join(x), "-", " ".join(y))
pat1 = "\$+|[a-z]+|[A-Z][a-z]+|[A-Z]+"
pat2 = "\d+|\,+"
getThePat(pat1)
getThePat(pat2)
输出:
ABC - DEF
AM - $
ABC - GTY
HUYT - ABC
MONET Data - ABC
10000 - 1
1 - 0 , 30
3500 - 1
1000 - 1
1 - 1