从普通文本中分割数字和符号

时间:2015-07-25 16:22:24

标签: python split numbers symbols

大家好我是一名java开发人员,但我是python中的新手,我想在python中翻译这段java代码:

    private static String split(String str) {
        List<String> output = new ArrayList<String>();
        Matcher match = Pattern.compile("[0-9,+]+|[a-z]+|[A-Z]").matcher(str);
        while (match.find()) {
            output.add(match.group());
        }
        String result="";
        for (String s:output){
            result+=s+" ";
        }
        return result;
    }

所以例如,如果输入是:&#34; aaaa + 1&#34;输出变为:&#34; aaaa + 1&#34;。

我已经尝试过使用:

def split(nome):
    r = re.findall('\d+|.\D+', nome)
    #m = r.match(nome)
    print(r)

但没有考虑符号(+)。

这里有其他例子:

auhsuahsAsaasaA+19090 ---> auhsuahsAsaasaA +19090 
+67433998AAAAAAA ---> +67433998 AAAAAAA
ARENA-89         ---> ARENA -89

你能帮我找一个解决方案吗?

2 个答案:

答案 0 :(得分:2)

尝试使用re.findall命令匹配所有连续字母和数字(带可选 - 或+ )。

 re.findall(r'[A-Za-z]+|[+-]?\d+', s)

示例:

>>> import re
>>> re.findall(r'[A-Za-z]+|[+-]?\d+', '"AAAA +2"')
['AAAA', '+2']
>>> re.findall(r'[A-Za-z]+|[+-]?\d+', 'auhsuahsAsaasaA+19090')
['auhsuahsAsaasaA', '+19090']
>>> re.findall(r'[A-Za-z]+|[+-]?\d+', '"AAAA +2"')
['AAAA', '+2']

答案 1 :(得分:0)

没有re模块

def divide(text):
    local_text=list(text)
    for i in range(1, len(local_text)):
        if local_text[i].isspace() or local_text[i-1].isspace():
            continue
        elif local_text[i-1].isalpha() != local_text[i].isalpha():
            local_text[i-1] += ' '
    return ''.join(local_text)

print(divide('auhsuahsAsaasaA+19090 +67433998AAAAAAA ARENA-89'))
...
auhsuahsAsaasaA +19090 +67433998 AAAAAAA ARENA -89