找到最短的子串

时间:2009-04-27 06:08:17

标签: python substring

我编写了一个代码来查找字符串中的子字符串。它打印所有子串。 但我想要一个范围从长度2到6的子字符串并打印最小长度的子字符串。 请帮帮我

程序:

import re
p=re.compile('S(.+?)N')
s='ASDFANSAAAAAFGNDASMPRKYN'
s1=p.findall(s)
print s1

输出:

['DFA', 'AAAAAFG', 'MPRKY']  

期望的输出:

'DFA'  length=3

2 个答案:

答案 0 :(得分:8)

如果您已有列表,则可以使用min函数和len函数作为第二个参数。

>>> s1 = ['DFA', 'AAAAAFG', 'MPRKY']
>>> min(s1, key=len)
'DFA'

修改
如果两个长度相同,您可以进一步扩展它以生成包含长度相同的元素的列表:

>>> s2 = ['foo', 'bar', 'baz', 'spam', 'eggs', 'knight']
>>> s2_min_len = len(min(s2, key=len))
>>> [e for e in s2 if len(e) is s2_min_len]
['foo', 'bar', 'baz']

当只有1'最短'元素时,上述应该有效。

编辑2:为了完成,至少根据我的简单测试,它应该更快,以计算最短元素的长度并在列表推导中使用它。更新如上。

答案 1 :(得分:3)

正则表达式'S(.{2,6}?)N'只会为您提供长度为2到6个字符的匹配项。

要返回最短匹配子字符串,请使用sorted(s1, key=len)[0]

完整示例:

import re
p=re.compile('S(.{2,6}?)N')
s='ASDFANSAAAAAFGNDASMPRKYNSAAN'
s1=p.findall(s)
if s1:
    print sorted(s1, key=len)[0]
    print min(s1, key=len) # as suggested by Nick Presta

这是通过按长度排序findall返回的列表,然后返回排序列表中的第一项来实现的。

编辑:Nick Presta的回答更优雅,我不知道min也可以采用key论证......