如何在scrapy中将两个元素连接在一起?

时间:2017-07-18 19:27:48

标签: python html web-scraping scrapy

我正在努力加入所有" The Text"在我的scrapy输出文件中分成一个字符串或一个项目。源代码如下:

<div class="sth">
  <h3 class="sth">The Text</h3>
  <h4 class="sth2">
    <span class="sth11">The Text</span>
  </h4>
  <h4 class="sth3">
    <span class="sth11">The Text</span>
    <span>The Text</span>
  </h4>
</div>

有没有一种好方法可以加入所有&#34; The Text&#34;元素一起组成一个项目还是一个字符串?

1 个答案:

答案 0 :(得分:0)

考虑到你想要任何包装div的子文本,你想用新行加入它们,你将在scrapy解析方法中运行它,你可以:

"\n".join(response.xpath("//div[@class='sth']/descendant::*/text()").extract())