我有以下html:
<span class="episode">Episode: <a href="/title/tt2071912/">
!Que ve el Bisbe!</a>
(2011)
</span>
我怎么能从中得到这一年?当我收到剧集对象时,它只会在<a>
:
result.cssselect('.episode')[0].text
'Episode: '
我到目前为止最好的是:
year = lxml.html.tostring(result.cssselect('.episode')[0]).split('(')[-1].split(')')[0]