使用scrapy访问嵌套标签内的类名

时间:2018-08-30 07:09:11

标签: python html css web-scraping scrapy

我有以下这份文件

    <p class="contact-info " onclick="_ct('clntphn', 'lspg');">
    <i class="res_contactic resultimg"></i>
    <span>
        <a>
            <b>
                <span class="mobilesv icon-dc"></span>
                <span class="mobilesv icon-fe"></span>
                <span class="mobilesv icon-ji"></span>
                <span class="mobilesv icon-yz"></span>
                <span class="mobilesv icon-hg"></span>
                <span class="mobilesv icon-ba"></span>
                <span class="mobilesv icon-ji"></span>
                <span class="mobilesv icon-yz"></span>
                <span class="mobilesv icon-rq"></span>
                <span class="mobilesv icon-wx"></span>
                <span class="mobilesv icon-ts"></span>
                <span class="mobilesv icon-rq"></span>
                <span class="mobilesv icon-vu"></span>
                <span class="mobilesv icon-ji"></span>
                <span class="mobilesv icon-vu"></span>
                <span class="mobilesv icon-po"></span>
            </b>
        </a>
    </span>
</p>

我有一个python字典,可将跨度类名称映射为数字。例如:

    [icon-dc:+,
     icon-fe:9
    ]
  1. 如何使用scrapy访问这些嵌套标签中的类名并获取联系信息?

1 个答案:

答案 0 :(得分:0)

尝试:response.css(span span::attr(class)).extract() 这将以['mobilesv icon-dc', 'mobilesv icon-fe', ...]的形式返回span的类列表 遍历列表,在space处拆分,获得第二个属性,然后从您的词典中找到内容。

希望这就是您要的内容,否则请告诉我。

谢谢。