我有一个像这样的pandas数据框:
admit gpa gre rank
0 3.61 380 3
1 3.67 660 3
1 3.19 640 4
0 2.93 520 4
现在我想获得pandas中的行列表,如:
[[0,3.61,380,3], [1,3.67,660,3], [1,3.19,640,4], [0,2.93,520,4]]
我该怎么做?
答案 0 :(得分:95)
您可以使用iterrows
:
temp=[]
for row in df.iterrows():
index, data = row
temp.append(data.tolist())
或者您也可以使用apply
:
df.apply(lambda x: x.tolist(), axis=1)
<强>更新强>
再次查看此内容后,还有一个内置方法也是最快的方法,在tolist
np数组上调用.values
:
In [62]:
df.values.tolist()
Out[62]:
[[0.0, 3.61, 380.0, 3.0],
[1.0, 3.67, 660.0, 3.0],
[1.0, 3.19, 640.0, 4.0],
[0.0, 2.93, 520.0, 4.0]]
答案 1 :(得分:26)
map(list, df.values)
答案 2 :(得分:9)
编辑:as_matrix
is deprecated since version 0.23.0
您可以在数据框中使用内置的values
或to_numpy
(推荐选项)方法:
In [8]:
df.to_numpy()
Out[8]:
array([[ 0.9, 7. , 5.2, ..., 13.3, 13.5, 8.9],
[ 0.9, 7. , 5.2, ..., 13.3, 13.5, 8.9],
[ 0.8, 6.1, 5.4, ..., 15.9, 14.4, 8.6],
...,
[ 0.2, 1.3, 2.3, ..., 16.1, 16.1, 10.8],
[ 0.2, 1.3, 2.4, ..., 16.5, 15.9, 11.4],
[ 0.2, 1.3, 2.4, ..., 16.5, 15.9, 11.4]])