Python:如何从字符串中分离出某些数字文本组合?

时间:2016-06-12 01:57:24

标签: python

例如:a = ['现在是10小时前20米','确定15秒后6小时']。我想time_fragment = ['20m','15s']。

我见过使用拆分功能和导入重复的答案,但没有看到任何解决数字组合案例的问题。这涉及到一些文本挖掘,因此数据很混乱。

1 个答案:

答案 0 :(得分:1)

如果您只想要"之前的时间,那么您可以在正则表达式中使用lookahead

import re
s = 'Now is 20m before 10h'
rgx = re.compile(r'[0-9]+[hms](?= *before)')
print rgx.findall(s) # ['20m']