例如:a = ['现在是10小时前20米','确定15秒后6小时']。我想time_fragment = ['20m','15s']。
我见过使用拆分功能和导入重复的答案,但没有看到任何解决数字组合案例的问题。这涉及到一些文本挖掘,因此数据很混乱。
答案 0 :(得分:1)
如果您只想要"之前的时间,那么您可以在正则表达式中使用lookahead。
import re
s = 'Now is 20m before 10h'
rgx = re.compile(r'[0-9]+[hms](?= *before)')
print rgx.findall(s) # ['20m']