Scrapy如何在类内部提取文本内部属性?

时间:2018-06-03 05:07:11

标签: python-3.x scrapy

我的HTML代码如下:

<div 
      class="hero-data__skills-item hero-data__skills-item-passive J-tooltip" 
      title='<div class="tootip">
                <div class="tootip-name">Royal Power</div>
                <div class="tootip-desc">Ketika HP Thane turun di bawah 30%, dia memulihkan 24% dari Max HP-nya selama 6 detik. Cooldown 75 detik.</div>
             </div>'>

</div>

使用此代码,我可以提取title属性:

response.css('.hero-data__skills-item::attr(title)').extract_first()

然后我从title属性中获取此代码:

<div class="tootip"><div class="tootip-name">Royal Power</div><div class="tootip-desc">Ketika HP Thane turun di bawah 30%, dia memulihkan 24% dari Max HP-nya selama 6 detik. Cooldown 75 detik.</div></div>

我想在title属性中的 tooltip-name 类中提取文本,因此我将获得 Royal Power

我该怎么办?

1 个答案:

答案 0 :(得分:2)

您可以针对任何文字创建单独的Selector

outer = response.css('.hero-data__skills-item::attr(title)').extract_first()
sel = Selector(text=outer)
name = sel.css('.tooltip-name::text').get()