Python / Scrapy问题:如何获得更清晰的结果?

时间:2011-07-06 19:01:57

标签: python data-mining pipeline scrapy

我的项目任务是为网站挖掘特定名称的数据。我对python的体验并不高。当我删除所有名称时,它们以这种格式出现:

[u'Bob Joe']
[u'Tim Tom'] [u'Anne Frank']
[u'superman']

如何清理这些值? 'u'表示什么?我的xpath错了吗?我是否必须在scrapy管道中清理它(我想避免这种情况)?我只想要名字,而不是周围的额外垃圾。

1 个答案:

答案 0 :(得分:1)

在Python 2中,'u'前缀表示它是一个Unicode字符串。 [u'Bob Joe']是包含Unicode字符串的列表。