如何将数据框中的多列转换为numpy数组?

时间:2019-08-27 22:04:06

标签: python arrays python-3.x pandas numpy

我有一个DataFrame,其中包含针对不同学生上学的数据。它具有rankmajor_codemajorunemployed等不同的列。

我使用df.values(在本例中为recent_grads.values)返回DataFrame的numpy表示形式。

recent_grads_np = recent_grads.values
print(recent_grads_np)

这与d.values一样,将整个DataFrame更改为Numpy数组。结果是这样的:

[[1 2419 'PETROLEUM ENGINEERING' ... 1534 364 193]
 [2 2416 'MINING AND MINERAL ENGINEERING' ... 350 257 50]
 [3 2415 'METALLURGICAL ENGINEERING' ... 456 176 0]
 ...
 [172 5203 'COUNSELING PSYCHOLOGY' ... 2403 1245 308]
 [173 3501 'LIBRARY SCIENCE' ... 288 338 192]]

如何从整个数据框中仅选择几列,然后转换为numpy数组?

1 个答案:

答案 0 :(得分:0)

您应该在数据框的末尾轻松使用“ .values”,它将为您提供numpy数组。

要选择特定的数据框列,您可以说df [[[“ A”,“ B”,“ C”]],其中“ A”,“ B”和“ C”是您的列名。

所以: df [[“” A,“ B”,“ C”]]。values

将满足您的要求。