Question

我想在熊猫数据框中获取行数据作为列表。我可以在木星笔记本中以正确的顺序（列顺序）获取数据，但是当我在ubuntu终端中以python文件的形式运行代码时，列表的顺序不正确。实际上，列表似乎是按升序排列的。

这是数据帧

Src_mac Dest_mac  Src_Port Dest_port  Byte_Count  duration  Packet_Count
0      02       01         2         1         238  1.000000             3
1      01       02         1         2         140  0.893617             2
2      03       01         2         1         238  0.489362             3
3      01       03         1         2         140  0.446809             2
4      04       01         2         1         238  0.021277             3
5      01       04         1         2         140  0.000000             2

从此代码

l=list(range(0,len(df.index)))
for i in l:
  d = df.iloc[i]
  ml_data = d.tolist()
  print(ml_data)

Jupyter Notebook中的输出如下

[2.0, 1.0, 2.0, 1.0, 238.0, 1.0, 3.0]
[1.0, 2.0, 1.0, 2.0, 140.0, 0.8936170212765937, 2.0]
[3.0, 1.0, 2.0, 1.0, 238.0, 0.4893617021276597, 3.0]
[1.0, 3.0, 1.0, 2.0, 140.0, 0.4468085106382951, 2.0]
[4.0, 1.0, 2.0, 1.0, 238.0, 0.02127659574468055, 3.0]
[1.0, 4.0, 1.0, 2.0, 140.0, 0.0, 2.0]

但是，如果我在ubuntu终端中运行与独立python文件相同的代码，我会得到此信息（顺序不正确）

[238.0, 1.0, 1.0, 3.0, 2.0, 2.0, 1.0]
[140.0, 2.0, 2.0, 2.0, 1.0, 1.0, 0.8936170212765937]
[238.0, 1.0, 1.0, 3.0, 2.0, 3.0, 0.4893617021276597]
[140.0, 3.0, 2.0, 2.0, 1.0, 1.0, 0.4468085106382951]
[238.0, 1.0, 1.0, 3.0, 2.0, 4.0, 0.02127659574468055]
[140.0, 4.0, 2.0, 2.0, 1.0, 1.0, 0.0]

我做错了什么

Answer 1

如果您使用的是pandas，则可以考虑使用

import pandas as pd
import numpy as np

df = pd.DataFrame(np.arange(9).reshape(3,3))

df.values.tolist()

这将返回

[[0, 1, 2], [3, 4, 5], [6, 7, 8]]

从熊猫数据框中获取行数据作为列表

1 个答案: