我正在努力加入所有" The Text"在我的scrapy输出文件中分成一个字符串或一个项目。源代码如下:
<div class="sth">
<h3 class="sth">The Text</h3>
<h4 class="sth2">
<span class="sth11">The Text</span>
</h4>
<h4 class="sth3">
<span class="sth11">The Text</span>
<span>The Text</span>
</h4>
</div>
有没有一种好方法可以加入所有&#34; The Text&#34;元素一起组成一个项目还是一个字符串?
答案 0 :(得分:0)
考虑到你想要任何包装div的子文本,你想用新行加入它们,你将在scrapy解析方法中运行它,你可以:
"\n".join(response.xpath("//div[@class='sth']/descendant::*/text()").extract())