我有一系列2X1列表数组,需要将它们展平两次。 Itertools.chain()将有效地做到这一点,但我想保留系列索引信息。
我在该系列中尝试了一个非常基本的双循环来访问每个元素,但是事实证明效率很低(我的数据集有〜1MM列表)。有没有更有效的方法来实现这一目标?
样品系列:
x = pd.Series([np.array([['a',1],[2,3]]), np.array([['b',4],[1,5],[7,9]]), np.array([['c',6],[7,8]])], name='x')
y=[]
for i in range(len(x)):
for c in x[i]:
y.append([i,c])
Input Series:
0 [[a, 1], [2, 3]]
1 [[b, 4], [1, 5], [7, 9]]
2 [[c, 6], [7, 8]]
Name: x, dtype: object
Expected Output:
[[0, [a, 1]]], [0, [2, 3]], [1, [b, 4]], [1, [1, 5]], [1, [7, 9]], [2, [c, 6]], [2, [7, 8]]]```
答案 0 :(得分:2)
您可以尝试使用list comprehension:
[[idx, v.tolist()] for idx, val in x.iteritems() for v in val]
[出]
[[0, ['a', '1']], [0, ['2', '3']], [1, ['b', '4']], [1, ['1', '5']], [1, ['7', '9']], [2, ['c', '6']], [2, ['7', '8']]]