我的项目任务是为网站挖掘特定名称的数据。我对python的体验并不高。当我删除所有名称时,它们以这种格式出现:
[u'Bob Joe']
[u'Tim Tom']
[u'Anne Frank']
[u'superman']
如何清理这些值? 'u'表示什么?我的xpath错了吗?我是否必须在scrapy管道中清理它(我想避免这种情况)?我只想要名字,而不是周围的额外垃圾。
答案 0 :(得分:1)
在Python 2中,'u'前缀表示它是一个Unicode字符串。 [u'Bob Joe']
是包含Unicode字符串的列表。