Scrapy不包括空格

时间:2017-11-12 06:06:54

标签: python xpath scrapy

我试过刮过一个链接(https://www.century21.com/real-estate/rock-spring-ga/LCGAROCKSPRING/)。我想提取"床"来自那里的数据。因为有些房子里面有一些空洞的细节,只有很少的床#34;提取细节。但是我希望得到所有细节。如果没有,那么它应该显示" NaN"或者其他的东西。另一个问题是我检查了这个标签:



response.xpath('//div[@class="property-beds"]/strong/text() | //div[@class="property-beds"]/text()'] 




我使用xpath命令提取" 2张床"。只有"床"显示nOT" 2张床"。所以我使用" |"统一2个元素。

<div>
   {
       this.props.articles.map(article => {
            return (
                <ArticleCard key={article._id} article={article} />
            )
        })
    }
</div>

这让我得到了正确的输出,但问题是它显示的结果是2条单独的线条(2条在一条线上,另一条线条在另一条线条上)。显示单行显示?

2 个答案:

答案 0 :(得分:2)

您可以在父元素上使用string()来提取元素和所有子节点的文本:

In [10]: root.xpath('string(//div[@class="property-beds"])')
Out[10]: '2 beds'

如果您有多个元素,则必须遍历//div[@class="property-beds"]匹配的元素,然后执行elem.xpath('string()')

答案 1 :(得分:0)

使用string()方法。 <option *ngFor="let unassigned of unassignedList" value="{{unassigned.org_id}}">{{unassigned.name}}</option> </select>