我有一个200k元素的列表。这些元素是7种不同的标签(实际上是水果列表)。我需要为每个水果分配一个数字。
有快速的方法吗?
到目前为止,我已经写过这篇文章了。这需要很长时间。
dic,i = {},0.0
for idx,el in enumerate(listFruit):
if dic.has_key(el) is not True:
dic[el] = i
i+=1.0
listFruit[idx] = dic[el]
答案 0 :(得分:5)
使用collections.defaultdict()
object与itertools.count()
object绑定,以生成下一个值作为工厂;这样就可以避免自己测试每个密钥,也不必手动增加密钥。
然后使用列表推导将这些数字放入列表中:
from collections import defaultdict
from functools import partial
from itertools import count
unique_count = defaultdict(partial(next, count(1)))
listFruit[:] = [unique_count[el] for el in listFruit]
functools.partial()
callable在next()
function周围创建一个包装器,以确保代码在Python 2或Python 3中工作。
我在这里使用整数计数,从1
开始。如果您坚持使用浮点值,则可以将count(1)
替换为count(1.0)
;您将获得1.0
,2.0
,3.0
等。
演示:
>>> from collections import defaultdict
>>> from functools import partial
>>> from itertools import count
>>> from random import choice
>>> fruits = ['apple', 'banana', 'pear', 'cherry', 'melon', 'kiwi', 'pineapple']
>>> listFruit = [choice(fruits) for _ in xrange(100)]
>>> unique_count = defaultdict(partial(next, count(1)))
>>> [unique_count[el] for el in listFruit]
[1, 2, 3, 2, 4, 5, 6, 7, 1, 2, 4, 6, 3, 7, 3, 4, 5, 2, 5, 7, 3, 5, 1, 3, 3, 5, 2, 2, 6, 4, 6, 2, 1, 1, 3, 6, 6, 4, 7, 2, 6, 4, 5, 2, 1, 7, 7, 7, 4, 3, 7, 3, 1, 1, 5, 3, 3, 6, 5, 6, 1, 4, 3, 7, 2, 7, 7, 4, 7, 1, 4, 3, 7, 3, 4, 5, 1, 5, 5, 1, 5, 6, 3, 4, 3, 1, 1, 1, 5, 7, 2, 2, 6, 3, 6, 1, 1, 6, 5, 4]
>>> unique_count
defaultdict(<functools.partial object at 0x1026c5788>, {'kiwi': 4, 'apple': 1, 'cherry': 5, 'pear': 2, 'pineapple': 6, 'melon': 7, 'banana': 3})
答案 1 :(得分:0)
fruit_list = ['apple', 'banana', 'strawberry', 'watermelon','apple','watermelon']
unique_fruits = [x for x in set(fruit_list)]
fruit_dict = dict((unique_fruits[y],y) for y in range(len(unique_fruits)))
result = [(x, fruit_dict.get(x)) for x in fruit_list if x in fruit_dict.keys()]
那样的东西?
结果:[('apple', 2), ('banana', 3), ('strawberry', 0), ('watermelon', 1), ('apple', 2), ('watermelon', 1)]
或result = [fruit_dict.get(x) for x in fruit_list if x in fruit_dict.keys()]
结果 - [2, 3, 0, 1, 2, 1]