我有一个DataFrame,其中包含针对不同学生上学的数据。它具有rank
,major_code
,major
,unemployed
等不同的列。
我使用df.values
(在本例中为recent_grads.values
)返回DataFrame的numpy表示形式。
recent_grads_np = recent_grads.values
print(recent_grads_np)
这与d.values
一样,将整个DataFrame更改为Numpy数组。结果是这样的:
[[1 2419 'PETROLEUM ENGINEERING' ... 1534 364 193]
[2 2416 'MINING AND MINERAL ENGINEERING' ... 350 257 50]
[3 2415 'METALLURGICAL ENGINEERING' ... 456 176 0]
...
[172 5203 'COUNSELING PSYCHOLOGY' ... 2403 1245 308]
[173 3501 'LIBRARY SCIENCE' ... 288 338 192]]
如何从整个数据框中仅选择几列,然后转换为numpy数组?
答案 0 :(得分:0)
您应该在数据框的末尾轻松使用“ .values”,它将为您提供numpy数组。
要选择特定的数据框列,您可以说df [[[“ A”,“ B”,“ C”]],其中“ A”,“ B”和“ C”是您的列名。
所以: df [[“” A,“ B”,“ C”]]。values
将满足您的要求。