scrapy:将数据结果删除到_sre.SRE_Match对象0x044f6ee0

时间:2013-09-04 05:41:00

标签: regex scrapy

我尝试使用正则表达式从https://www.healthcaresource.com/lourdesnet/index.cfm?cJobId=404873&fuseaction=search.jobDetails&template=dsp_job_details.cfm

获取数据

并且href给了我

javascript:openit('?fuseaction=apply.login&template=dsp_apply_login.cfm&cJobId=404873');toggleElement('applyLinks_1'); toggleElement('externalApplyConfirm_1');

我只想得到

?fuseaction=apply.login&template=dsp_apply_login.cfm&cJobId=404873

我的代码是

link = infoer.select('@onclick').extract()[0]
item ["info"] = re.search("\'(\?[^\s]+)\&(cJobId\=\d+\')", link)

但它会导致_sre.SRE_Match对象位于0x044f6ee0

1 个答案:

答案 0 :(得分:1)

您需要使用group()方法。此外,'(.*?)'表达式看起来更具适应性:

item ["info"] = re.search("'(.*?)'", link).group(1)