我正在尝试拆分具有可以动态更改的日期块的字符串。
source = purchase_volume (as of Oct 31, 2013)>4.5</n>
purchase_volume =source.split('purchase_volume (as of Oct 31, 2013)>')[1].split('</n>)[0]
日期会改变,格式不会。如何动态地告诉它忽略日期的变化,但仍然给我正确的分割?
答案 0 :(得分:0)
如何使用>
作为分隔符?
>>> source = 'purchase_volume (as of Oct 31, 2013)>4.5</n>'
>>> source.split('>', 1)[-1].split('</n>', 1)[0]
'4.5'
答案 1 :(得分:0)
如果您尝试使用相关日期提取金额,请尝试以下操作:
>>> pttrn = re.compile('([A-Z]{3}\s+[0-9]{2},\s+[0-9]{4})\)>(\d+\.?\d+)</n>', re.IGNORECASE)
>>> d,a = re.findall(pttrn, s)[0]
>>> d
'Oct 31, 2013'
>>> a
'4.5'