我正在尝试加载一个如下所示的数据集:
Algeria,73.131000,6406.8166213983,0.1
Angola,51.093000,5519.1831786593,2
Argentina,75.901000,15741.0457726686,0.5
Armenia,74.241000,4748.9285847709,0.1
等。最后,我只需要第1列和第2列。我不需要国名和最后一栏。基本上,我需要提取两个尺寸为nx1的矩阵。我知道我需要指定数据类型:
data=np.loadtxt('file.txt',delimiter=',',dtype=[('f0',str),('f1',float),('f2',float),('f3',float)])
然而,这会产生一个元组列表,
array([('', 73.131, 6406.8166213983, 0.1),
('', 51.093, 5519.1831786593, 2.0),`
而不是
array(['',73.131,6406.8166213983,0.1],
['',51.093, 5519.1831786593, 2.0],
错误在哪里?
答案 0 :(得分:10)
答案 1 :(得分:1)
如果您只想要前两列,可以使用genfromtxt
:
import numpy as np
col1 = np.genfromtxt('yourfile.txt',usecols=(1),delimiter=',',dtype=None)
col2 = np.genfromtxt('yourfile.txt',usecols=(2),delimiter=',',dtype=None)
或两者一起:
np.genfromtxt('yourfile.txt',usecols=(1,2),delimiter=',',dtype=None)
答案 2 :(得分:0)
你的“错误”是你设置了自己的dtype。如果你不想要你设置的dtype(我认为没有理由你不想要它),你可以使用np.loadtxt()的skiprows和usecols参数来加载你想要的列。
你的结果将是一个NumPy数组,其形状为(n,2),而不是(n,3)你认为你有(n是你的行数)。