我想在熊猫数据框中获取行数据作为列表。我可以在木星笔记本中以正确的顺序(列顺序)获取数据,但是当我在ubuntu终端中以python文件的形式运行代码时,列表的顺序不正确。实际上,列表似乎是按升序排列的。
这是数据帧
Src_mac Dest_mac Src_Port Dest_port Byte_Count duration Packet_Count
0 02 01 2 1 238 1.000000 3
1 01 02 1 2 140 0.893617 2
2 03 01 2 1 238 0.489362 3
3 01 03 1 2 140 0.446809 2
4 04 01 2 1 238 0.021277 3
5 01 04 1 2 140 0.000000 2
从此代码
l=list(range(0,len(df.index)))
for i in l:
d = df.iloc[i]
ml_data = d.tolist()
print(ml_data)
Jupyter Notebook中的输出如下
[2.0, 1.0, 2.0, 1.0, 238.0, 1.0, 3.0]
[1.0, 2.0, 1.0, 2.0, 140.0, 0.8936170212765937, 2.0]
[3.0, 1.0, 2.0, 1.0, 238.0, 0.4893617021276597, 3.0]
[1.0, 3.0, 1.0, 2.0, 140.0, 0.4468085106382951, 2.0]
[4.0, 1.0, 2.0, 1.0, 238.0, 0.02127659574468055, 3.0]
[1.0, 4.0, 1.0, 2.0, 140.0, 0.0, 2.0]
但是,如果我在ubuntu终端中运行与独立python文件相同的代码,我会得到此信息(顺序不正确)
[238.0, 1.0, 1.0, 3.0, 2.0, 2.0, 1.0]
[140.0, 2.0, 2.0, 2.0, 1.0, 1.0, 0.8936170212765937]
[238.0, 1.0, 1.0, 3.0, 2.0, 3.0, 0.4893617021276597]
[140.0, 3.0, 2.0, 2.0, 1.0, 1.0, 0.4468085106382951]
[238.0, 1.0, 1.0, 3.0, 2.0, 4.0, 0.02127659574468055]
[140.0, 4.0, 2.0, 2.0, 1.0, 1.0, 0.0]
我做错了什么
答案 0 :(得分:0)
如果您使用的是pandas
,则可以考虑使用
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(9).reshape(3,3))
df.values.tolist()
这将返回
[[0, 1, 2], [3, 4, 5], [6, 7, 8]]