如何将列表列转换为非嵌套列表?

时间:2017-06-26 05:56:10

标签: python pandas

如何在列元素为列表时将列转换为非嵌套列表?

例如,列就像

column
[1, 2, 3]
[1, 2]

我最后想要关注。

[1,2,3,1,2]

但是现在column.tolist(),我会得到

[[1,2,3],[1,2]]
编辑:谢谢你的帮助。我的目的是找到最简单(优雅)和有效的方法来做到这一点。现在我使用@jezrael方法。

from itertools import chain
output = list(chain.from_iterable(df[column])

最简单的方法由@piRSquared提供,但可能更慢。

output = df[column].values.sum()

4 个答案:

答案 0 :(得分:7)

您可以使用numpy.concatenate

print (np.concatenate(df['column'].values).tolist())
[1, 2, 3, 1, 2]

或者:

from  itertools import chain
print (list(chain.from_iterable(df['column'])))
[1, 2, 3, 1, 2]

另一种解决方案,谢谢juanpa.arrivillaga

print ([item for sublist in df['column'] for item in sublist])
[1, 2, 3, 1, 2]

<强>计时

df = pd.DataFrame({'column':[[1,2,3], [1,2]]})
df = pd.concat([df]*10000).reset_index(drop=True)
print (df)

In [77]: %timeit (np.concatenate(df['column'].values).tolist())
10 loops, best of 3: 22.7 ms per loop

In [78]: %timeit (list(chain.from_iterable(df['column'])))
1000 loops, best of 3: 1.44 ms per loop

In [79]: %timeit ([item for sublist in df['column'] for item in sublist])
100 loops, best of 3: 2.31 ms per loop

In [80]: %timeit df.column.sum()
1 loop, best of 3: 1.34 s per loop

答案 1 :(得分:2)

我们将列表与+运算符连接起来。因为熊猫系列使用它的&#39;当您调用+时,pd.Series.sum操作的基础元素,我们可以连接整个列或列的系列。

df.column.sum()

[1, 2, 3, 1, 2]

但如果您正在寻找效果,可以考虑cytoolz.concat

import cytoolz

list(cytoolz.concat(df.column.values.tolist()))

[1, 2, 3, 1, 2]

答案 2 :(得分:0)

您可以使用list的append方法执行此操作:

col = {'col': [[1, 2, 3], [1, 2]]}
last = []
last.extend([i for c in col['col'] for i in c])

答案 3 :(得分:0)

另一种有效的解决方案是list.extend()方法。

list = [] for row in column: list.extend(row)