我有很多地址样式字符串,我想以合理的方式对它们进行排序。
我正在寻找填充字符串中的所有数字,以便:“Flat 12A High Rise”变为“Flat 00012A High Rise”,字符串中可能有多个数字。
到目前为止,我已经:
def pad_numbers_in_string(string, padding=5):
numbers = re.findall("\d+", string)
padded_string = ''
for number in numbers:
parts = string.partition(number)
string = parts[2]
padded_string += "%s%s" % (parts[0], parts[1].zfill(padding))
padded_string += string
return padded_string
可以改进 - 看起来很麻烦!
答案 0 :(得分:9)
不要更改数据以适应排序算法,而是更改排序算法以适应您的数据。
请参阅Sorting For Humans: Natural Sort Order上的Coding Horror:
import re
def sort_nicely( l ):
""" Sort the given list in the way that humans expect.
"""
convert = lambda text: int(text) if text.isdigit() else text
alphanum_key = lambda key: [ convert(c) for c in re.split('([0-9]+)', key) ]
l.sort( key=alphanum_key )
答案 1 :(得分:7)
这个怎么样?
re.sub('\d+', lambda x:x.group().zfill(padding), s)
示例:
>>> s = "Flat 12A High Rise 101B"
>>> padding = 5
>>> re.sub('\d+', lambda x:x.group().zfill(padding), s)
'Flat 00012A High Rise 00101B'
>>>