入门帮助-废弃电子商务网站

时间:2018-08-27 07:21:35

标签: scrapy scrapy-spider

我是新手,不喜欢爬网和爬网。我正在尝试从印度的电子商务网站中删除数据,但无法这样做。

我正在尝试从以下超链接中提取文本:

<a ng-href="/pd/40011505/figaro-extra-virgin-olive-oil-1-ltr/?nc=cl-prod-list&amp;t_pg=&amp;t_p=&amp;t_s=cl-prod-list&amp;t_pos=1&amp;t_ch=desktop" ng-click="vm.pushToGoogleAnalytics('_trackEvent','item-clicked','custom-page',sectionModel.display_pos+' | '+sectionModel.pageinternalName+' | LNPD | '+sectionModel.internalName+' | '+vm.selectedProduct.sku+' | '+vm.selectedProduct.p_desc +' | '+ vm.itemposition,1)" class="ng-binding" style="text-align: left;" data-original-title="" data-trigger="focus" uib-tooltip="Extra Virgin Olive Oil" data-sectioninteractionplower="{&quot;EventName&quot;:&quot;ItemClicked&quot;, &quot;CustomPageGroup&quot; : &quot;&quot;, &quot;CustomPage&quot;:&quot;&quot;, &quot;ScreenInPageContext&quot; : &quot;cl-prod-list&quot;, &quot;ScreenInPagePosition&quot;:&quot;1&quot;,
            &quot;SectionItemName&quot;:&quot;&quot;, &quot;SectionItemPosition&quot;:&quot;1&quot;}" ng-bind="vm.selectedProduct.p_desc" href="/pd/40011505/figaro-extra-virgin-olive-oil-1-ltr/?nc=cl-prod-list&amp;t_pg=&amp;t_p=&amp;t_s=cl-prod-list&amp;t_pos=1&amp;t_ch=desktop" css="1">Extra Virgin Olive Oil</a>

Xpath / Css选择器对我不起作用。

感谢任何帮助。

1 个答案:

答案 0 :(得分:0)

要从a标签获取文本,我将使用以下css选择器

resp.css('a::text').extract()

响应:

['Extra Virgin Olive Oil']