应用错误收集

Python / Scrapy问题：如何获得更清晰的结果？

时间：2011-07-06 19:01:57

标签： python data-mining pipeline scrapy

我的项目任务是为网站挖掘特定名称的数据。我对python的体验并不高。当我删除所有名称时，它们以这种格式出现：

[u'Bob Joe']
[u'Tim Tom'] [u'Anne Frank']
[u'superman']

如何清理这些值？ 'u'表示什么？我的xpath错了吗？我是否必须在scrapy管道中清理它（我想避免这种情况）？我只想要名字，而不是周围的额外垃圾。

1 个答案:

答案 0 :(得分：1)

在Python 2中，'u'前缀表示它是一个Unicode字符串。 [u'Bob Joe']是包含Unicode字符串的列表。