如果我带着
进入scrapy shellscrapy shell http://www.tripadvisor.com/Hotels-g60956-San_Antonio_Texas-Hotels.html
并致电
hxs.select('//title/text()').extract
我得到了
data=u'San Antonio Hotels: Compare 345 Hotels i'
这是空格的40个字符。这是一个超出Scrapy的限制,我也应该在未来的unicode交易中注意这一点吗?
答案 0 :(得分:2)
你必须将提取函数括起来
hxs.select('//title/text()').extract()
现在您将能够获得全文
答案 1 :(得分:1)
hxs.select("//title/text()").extract()
将返回完整的字符串
在没有()的情况下使用它可能会返回一个对象的表示,该表示被限制(用于检查)到40个字符。