我有以下数据框:
import numpy as np
import pandas as pd
import random
df = pd.DataFrame(np.random.randint(0,20,size=(2, 2)), columns=list('AB'))
df
A B
0 13 4
1 16 17
然后,我在循环中创建另一个数据框,其中数据框的列为列表。此处(Pandas split column of lists into multiple columns)上有一篇文章,显示如何拆分列。
tmp_lst_1 = []
for index, row in df.iterrows():
tmp_lst_2 = []
for r in range(len(row)):
tmp_lst_2.insert(r, random.sample(range(1, 50), 2) )
tmp_lst_1.insert(index, tmp_lst_2)
df1 = pd.DataFrame(tmp_lst_1)
df1
0 1
0 [21, 5] [6, 42]
1 [49, 40] [8, 45]
但是我想知道是否有一种更有效的方法来创建此数据框而无需单独拆分所有列?我正在寻找这样的东西:
df1
C D E F
0 21 5 6 42
1 49 40 8 45
答案 0 :(得分:0)
我认为这里不需要DataFrame.iterrows
循环,您可以对flattening lists使用嵌套列表理解:
df = pd.DataFrame(np.random.randint(0,20,size=(2, 2)), columns=list('AB'))
tmp_lst_1 = [[x for r in range(len(df.columns))
for x in random.sample(range(1, 50), 2)]
for i in range(len(df))]
df1 = pd.DataFrame(tmp_lst_1, index=df.index)
print (df1)
0 1 2 3
0 23 24 42 48
1 26 43 24 5
不带列表理解的替代方法:
tmp_lst_1 = []
for i in range(len(df)):
flat_list = []
for r in range(len(df.columns)):
for x in random.sample(range(1, 50), 2):
flat_list.append(x)
tmp_lst_1.append(flat_list)