所以我有一列标签看起来像这样:
Array([list(['r']), list(['php', 'mysql']), list(['c#']), ...,
list(['python', 'datetime', 'pandas']),
list(['javascript', 'jquery']), list(['java', 'list',
'generics'])],
dtype=object)
每行都是标签列表。(我们有100000行)
我想将所有标签放在一个列表中,为此我编写了两个代码。
def liste_tags():
list=[]
for l in tags_train :
for tag in l :
list.append(tag)
return list
tag_w=[]
for i in range(0,100000):
tag_w=tag_w+y_train[i] # tage_w contain all tags that are present in train dataset
所以我不明白的是为什么第二个代码要花太多时间执行而第一个代码只花几秒钟。我的意思是它们都遍历了100000行,所以为什么2Nd需要更多时间?