Question

我们有一堆字符串，例如：c1309，IF1306，v1309，p1209，a1309，mo1309。
在Python中，删除数字的最佳方法是什么？我需要的只是：上面示例中的c，IF，v，p，a，mo。

Answer 1

您可以使用regex：

>>> import re
>>> strs = "c1309, IF1306, v1309, p1209, a1309, mo1309"
>>> re.sub(r'\d','',strs)
'c, IF, v, p, a, mo'

或更快的版本：

>>> re.sub(r'\d+','',strs)
'c, IF, v, p, a, mo'

timeit比较：

>>> strs = "c1309, IF1306, v1309, p1209, a1309, mo1309"*10**5

>>> %timeit re.sub(r'\d','',strs)
1 loops, best of 3: 1.23 s per loop

>>> %timeit re.sub(r'\d+','',strs)
1 loops, best of 3: 480 ms per loop

>>> %timeit ''.join([c for c in strs if not c.isdigit()])
1 loops, best of 3: 1.07 s per loop

#winner
>>> %timeit from string import digits;strs.translate(None, digits)
10 loops, best of 3: 20.4 ms per loop

Answer 2

>>> text = 'mo1309'
>>> ''.join([c for c in text if not c.isdigit()])
'mo'

这比正则表达式快

python -m timeit -s "import re; text = 'mo1309'" "re.sub(r'\d','',text)"
100000 loops, best of 3: 3.99 usec per loop
python -m timeit -s "import re; text = 'mo1309'" "''.join([c for c in text if not c.isdigit()])"
1000000 loops, best of 3: 1.42 usec per loop
python -m timeit -s "from string import digits; text = 'mo1309'" "text.translate(None, digits)"
1000000 loops, best of 3: 0.42 usec per loop

但str.translate建议@DavidSousa：

from string import digits
text.translate(None, digits)

始终是剥离字符最快的。

同样itertools提供了一个名为ifilterfalse

的鲜为人知的函数

>>> from itertools import ifilterfalse
>>> ''.join(ifilterfalse(str.isdigit, text))
'mo'

Answer 3

我认为字符串方法translate比加入列表等更优雅。

from string import digits # digits = '0123456789'
list1 = ['c1309', 'IF1306', 'v1309', 'p1209', 'a1309', 'mo1309']
list2 = [ i.translate(None, digits) for i in list1 ]

Answer 4

我认为这是最简单的，也可能是最快的。

>>> import string
>>> s = 'c1309, IF1306, v1309, p1209, a1309, mo1309'
>>> s.translate(None, string.digits)
'c, IF, v, p, a, mo'

注意：str.translate的界面已更改为在python3中使用映射，所以这里是3版本

s.translate({ord(n): None for n in string.digits})

或者更明确的选择：

m = str.maketrans('', '', string.digits)
s.translate(m)

Answer 5

strings = ['c1309', 'IF1306', 'v1309', 'p1209', 'a1309', 'mo1309']
stripped = [''.join(c for c in s if not c.isdigit()) for s in strings]

Answer 6

如果您正在处理的所有字符串结束，您可以使用字面，strip数字：< / p>

>>> strings = ['c1309', 'IF1306', 'v1309', 'p1209', 'a1309', 'mo1309']
>>> [s.strip("0123456789") for s in strings]
['c', 'IF', 'v', 'p', 'a', 'mo']

如果您要删除字符串末尾的仅数字，请使用rstrip。如果数字可能出现在字符串中，则此方法根本不起作用。

Answer 7

如果数字长度固定且位置不在字符串中间，则使用切片表示法。

NUM_LEN = 4
stringsWithDigit = ["ab1234", "cde1234", "fgh5678"]
for i in stringsWithDigit:
   print i[:-NUM_LEN]

其他任何事情

import re
c = re.compile("[^0-9]+")
print c.findall("".join(stringsWithDigit))

Answer 8

你可以试试这个正则表达式：

^[a-zA-Z]+

它只需要连续的字母from start并忽略字符串中的所有其他内容。

无需更换。

从字符串中删除数字

8 个答案: