我编写了一个代码来查找字符串中的子字符串。它打印所有子串。 但我想要一个范围从长度2到6的子字符串并打印最小长度的子字符串。 请帮帮我
程序:
import re
p=re.compile('S(.+?)N')
s='ASDFANSAAAAAFGNDASMPRKYN'
s1=p.findall(s)
print s1
输出:
['DFA', 'AAAAAFG', 'MPRKY']
期望的输出:
'DFA' length=3
答案 0 :(得分:8)
如果您已有列表,则可以使用min函数和len函数作为第二个参数。
>>> s1 = ['DFA', 'AAAAAFG', 'MPRKY']
>>> min(s1, key=len)
'DFA'
修改强>
如果两个长度相同,您可以进一步扩展它以生成包含长度相同的元素的列表:
>>> s2 = ['foo', 'bar', 'baz', 'spam', 'eggs', 'knight']
>>> s2_min_len = len(min(s2, key=len))
>>> [e for e in s2 if len(e) is s2_min_len]
['foo', 'bar', 'baz']
当只有1'最短'元素时,上述应该有效。
编辑2:为了完成,至少根据我的简单测试,它应该更快,以计算最短元素的长度并在列表推导中使用它。更新如上。
答案 1 :(得分:3)
正则表达式'S(.{2,6}?)N'
只会为您提供长度为2到6个字符的匹配项。
要返回最短匹配子字符串,请使用sorted(s1, key=len)[0]
。
完整示例:
import re
p=re.compile('S(.{2,6}?)N')
s='ASDFANSAAAAAFGNDASMPRKYNSAAN'
s1=p.findall(s)
if s1:
print sorted(s1, key=len)[0]
print min(s1, key=len) # as suggested by Nick Presta
这是通过按长度排序findall
返回的列表,然后返回排序列表中的第一项来实现的。
编辑:Nick Presta的回答更优雅,我不知道min
也可以采用key
论证......